把大模型「放进电脑里」,会出现一种很奇特的反差: 它能写代码、能推理、能把论文总结得头头是道;但一旦让它去操作 Excel、Word 这种真实桌面软件,却像第一次用电脑的人 -- 点错菜单、来回切换,甚至在同一页里循环点击。 很多人第一反应会觉得是 Agent 没看清按钮,或者没理解任务,不知道界面上各个选项是什么意思。但在真实软件里,更大的问题往往不是「看不见」,而是「不知道点下去会发生什么」。
【新智元导读】GPT-5.4,已经把白领桌面一口吞下!1M上下文,原生Computer Use,Excel直接变身数据分析平台;超越麦肯锡,取代投行律所咨询公司不是梦。白领工作,要被AI彻底颠覆了吗?
GPT-5.4,已经把白领桌面一口吞下!1M 上下文,原生 Computer Use,Excel 直接变身数据分析平台;超越麦肯锡,取代投行律所咨询公司不是梦。白领工作,要被 AI 彻底颠覆了吗? 前天,OpenAI 发布了 GPT-5.4,震惊了整个 AI 圈。100 万 token 的上下文,「编程 + 智能体」的巨大飞跃,原生的 computer use,所有这些,都将彻底改变 AI 智能体 ...
就在刚刚,OpenAI 头号竞争对手 Anthropic 推出了 “computer use” 功能,让 Claude 能够像人类一样操作电脑了!看屏幕、动光标、点按钮、打字等。通过 API,开发者可以让 Claude 将指令翻译成计算机指令,从而解放一些枯燥的重复性流程任务。 一、西方的Anthropic 的 ...
智通财经APP获悉,国金证券发布研报称,GPT-5.4的发布标志着AI从“对话生成”向“任务执行”的关键跃迁,通过原生Computer Use、Tool ...
从协作到执行,桌面 Agent 正在重塑 AI 在现实世界中的角色。它为办公效率提供了前所未有的可能,也带来了系统权限与隐私边界的深层挑战。 效率与隐私的博弈,并非此消彼长,而是需要通过制度设计达成新的平衡。当 AI 开始“动手”,监管与产品设计也必须同步进化。否则,执行能力越强,风险外溢越快。
谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。简单来说,与 OpenAI 的 Computer-Using ...
为了揭开真相,有人亲自对GPT-5.4进行了大半天的测试,得出的结论是:它确实取得了显著进步,但远未达到宣传中的神奇程度。测试过程中,有些场景令人惊叹,有些则让人哭笑不得。可以确定的是,ChatGPT-5.4绝非仅仅内置了一个OpenClaw那么简单,它标志着ChatGPT终于学会了“动手”。
当地时间2月25日,AI企业Anthropic宣布收购西雅图AI初创公司Vercept,以补齐旗下智能体工具Computer Use的视觉短板。 Computer Use是Anthropic为旗下大模型Claude打造的核心能力,于2024年10月随Claude 3.5 Sonnet一同推出,可支持Claude像人类一样完成看屏幕、操控键鼠、操作软件等动作,处理多步骤跨应用复杂任务,是Anthro ...
OpenAI最新发布的GPT-5.4模型引发科技圈热议,其内置的"原生电脑操控能力"成为焦点。这项被称作Native Computer Use的技术突破,标志着人工智能开始具备直接操作计算机的物理能力,而不再局限于文字交互层面。