OpenAI神秘工具即将问世-接管用户的个人电脑,并代表用户执行各种操作

OpenAI神秘工具即将问世-接管用户的个人电脑,并代表用户执行各种操作

OpenAI神秘工具或近发布,引发行业关注

近期,有消息传出OpenAI可能即将推出一款AI工具,这款工具据称能够接管用户的个人电脑,并代表用户执行各种操作。

爆料者Tibor Blaho是一位在准确泄露即将推出的AI产品方面颇具声誉的软件工程师。他宣称发现了OpenAI传闻已久的Operator工具的相关证据。此前,包括彭博社在内的多家媒体都曾报道过Operator。据了解,Operator是一个“智能代理”系统,具备自动处理诸如编写代码、预订旅行等任务的能力。据《The Information》消息,OpenAI计划在1月份发布Operator。

Blaho本周末发现的代码为这一报道增添了可信度。他指出,OpenAI的macOS版ChatGPT客户端已增加了一些目前隐藏的选项,可用于定义“切换Operator”和“强制退出Operator”的快捷方式。此外,OpenAI在其网站上也添加了对Operator的引用,尽管目前这些引用尚未对公众可见。Blaho还透露,OpenAI的网站包含尚未公开的表格,用于比较Operator与其他操控计算机的AI系统的性能。这些表格可能只是占位符,但如果其中数据准确,那就表明Operator的可靠性并非100%,其表现会因任务而异。

在模拟真实计算机环境的OSWorld基准测试中,“OpenAI计算机使用代理(CUA)”——可能是为Operator提供动力的AI模型——得分38.1%,领先于Anthropic的计算机控制模型,但与人类72.4%的得分仍有较大差距。在评估AI浏览和与网站交互能力的WebVoyager测试中,OpenAI CUA超越了人类表现。然而,根据泄露的基准测试,该模型在另一个基于网络的基准测试WebArena中,得分低于人类水平。

若爆料属实,Operator在一些人类轻易就能完成的任务上也存在困难。例如,在一项要求Operator注册云服务提供商并启动虚拟机的测试中,其成功率仅为60%。而在创建比特币钱包的任务中,成功率更是只有10%。

我们已向OpenAI寻求评论,若收到回复,将及时更新报道。值得注意的是,OpenAI即将进入AI代理领域,而此时其竞争对手,如Anthropic、谷歌等也都在积极布局这一新兴领域。AI代理虽然具有一定风险和投机性,但科技巨头们已将其视为AI领域的下一个重大发展方向。据分析公司Markets and Markets预测,到2030年,AI代理市场价值可能达到471亿美元。

目前的AI代理技术还相对原始,但一些专家已对其安全性表示担忧,若该技术快速发展,可能带来诸多问题。一份泄露的图表显示,Operator在某些安全评估测试中表现良好,包括试图让系统执行“非法活动”和搜索“敏感个人数据”的测试。据报道,安全测试是Operator开发周期漫长的原因之一。

在近期的一篇X(原推特)帖子中,OpenAI联合创始人Wojciech Zaremba批评Anthropic发布的一款代理缺乏安全防范措施。他写道:“我只能想象如果OpenAI做出类似发布,会引发怎样的负面反应。”值得一提的是,OpenAI此前就曾被AI研究人员(包括前员工)批评,称其为快速将技术产品化,而忽视了安全工作。

© 版权声明

相关文章

暂无评论

暂无评论...