OpenAI神秘工具即将问世-接管用户的个人电脑，并代表用户执行各种操作

OpenAI神秘工具或近发布，引发行业关注

近期，有消息传出OpenAI可能即将推出一款AI工具，这款工具据称能够接管用户的个人电脑，并代表用户执行各种操作。

爆料者Tibor Blaho是一位在准确泄露即将推出的AI产品方面颇具声誉的软件工程师。他宣称发现了OpenAI传闻已久的Operator工具的相关证据。此前，包括彭博社在内的多家媒体都曾报道过Operator。据了解，Operator是一个“智能代理”系统，具备自动处理诸如编写代码、预订旅行等任务的能力。据《The Information》消息，OpenAI计划在1月份发布Operator。

Blaho本周末发现的代码为这一报道增添了可信度。他指出，OpenAI的macOS版ChatGPT客户端已增加了一些目前隐藏的选项，可用于定义“切换Operator”和“强制退出Operator”的快捷方式。此外，OpenAI在其网站上也添加了对Operator的引用，尽管目前这些引用尚未对公众可见。Blaho还透露，OpenAI的网站包含尚未公开的表格，用于比较Operator与其他操控计算机的AI系统的性能。这些表格可能只是占位符，但如果其中数据准确，那就表明Operator的可靠性并非100%，其表现会因任务而异。

在模拟真实计算机环境的OSWorld基准测试中，“OpenAI计算机使用代理（CUA）”——可能是为Operator提供动力的AI模型——得分38.1%，领先于Anthropic的计算机控制模型，但与人类72.4%的得分仍有较大差距。在评估AI浏览和与网站交互能力的WebVoyager测试中，OpenAI CUA超越了人类表现。然而，根据泄露的基准测试，该模型在另一个基于网络的基准测试WebArena中，得分低于人类水平。

若爆料属实，Operator在一些人类轻易就能完成的任务上也存在困难。例如，在一项要求Operator注册云服务提供商并启动虚拟机的测试中，其成功率仅为60%。而在创建比特币钱包的任务中，成功率更是只有10%。

我们已向OpenAI寻求评论，若收到回复，将及时更新报道。值得注意的是，OpenAI即将进入AI代理领域，而此时其竞争对手，如Anthropic、谷歌等也都在积极布局这一新兴领域。AI代理虽然具有一定风险和投机性，但科技巨头们已将其视为AI领域的下一个重大发展方向。据分析公司Markets and Markets预测，到2030年，AI代理市场价值可能达到471亿美元。

目前的AI代理技术还相对原始，但一些专家已对其安全性表示担忧，若该技术快速发展，可能带来诸多问题。一份泄露的图表显示，Operator在某些安全评估测试中表现良好，包括试图让系统执行“非法活动”和搜索“敏感个人数据”的测试。据报道，安全测试是Operator开发周期漫长的原因之一。

在近期的一篇X（原推特）帖子中，OpenAI联合创始人Wojciech Zaremba批评Anthropic发布的一款代理缺乏安全防范措施。他写道：“我只能想象如果OpenAI做出类似发布，会引发怎样的负面反应。”值得一提的是，OpenAI此前就曾被AI研究人员（包括前员工）批评，称其为快速将技术产品化，而忽视了安全工作。

# AI头条 # OpenAI

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

OpenAI神秘工具即将问世-接管用户的个人电脑，并代表用户执行各种操作

OpenAI神秘工具或近发布，引发行业关注

初创公司倒闭，员工数据竟面临如此高风险

英国政府AI汉弗莱计划大揭秘-剑指官僚作风削减，助力公务员效率

相关文章

暂无评论