重磅!OpenAI推出自主执行任务的AI特工Operator

字数 1281,阅读大约需 7 分钟

重磅!OpenAI推出自主执行任务的AI特工Operator
OpenAI是人工智能研究与开发领域的重要机构,致力于推动AI技术的发展与应用,旗下拥有ChatGPT等知名产品。

OpenAI推出Operator:自主执行任务的AI特工

2025年,AI领域持续创新发展,其中引人瞩目的是OpenAI在AI特工领域的新动作。OpenAI首席执行官Sam Altman年初便在博客中预示2025年将是AI特工大放异彩之年,如今,OpenAI迈出了重要一步,推出了Operator这一通用型AI特工的研究预览版。

Operator的功能与适用范围
Operator能够掌控网页浏览器,独立执行特定操作。它承诺可实现旅行住宿预订、餐厅预订、在线购物等任务自动化。用户在Operator界面中有购物、配送、餐饮、旅行等多种任务类别可选,不同类别对应不同自动化功能。比如,用户计划去旅游,只需通过Operator下达指令,它就能在各大旅游平台上搜索合适的酒店和机票,并完成预订流程。

目前,Operator首先面向美国地区订阅ChatGPT $200 Pro套餐的用户开放。OpenAI表示,后续会逐步将此功能推广至Plus、Team和Enterprise等级别的更多用户,且很快会在其他国家上线,不过欧洲地区可能还需一段时间。该研究预览版目前可通过operator.chatgpt.com[1]访问,未来OpenAI打算将其集成到所有ChatGPT客户端。

技术支撑:Computer – Using Agent模型
Operator由Computer – Using Agent(CUA)模型驱动,该模型融合了OpenAI公司GPT – 4o模型的视觉能力与更先进模型的推理能力。CUA经过训练,能与网站前端交互,无需借助面向开发者的API,就能像人类一样操作网页上的按钮、导航菜单、填写表单。例如,在电商平台购物时,它可以自行点击商品链接、选择规格、添加到购物车并完成支付前的操作。

为确保Operator遵守相关企业的服务条款协议,OpenAI与DoorDash、eBay、Instacart、Priceline、StubHub和Uber等公司展开合作。

安全与确认机制
CUA模型在完成可能产生外部影响的任务(如提交订单、发送邮件等)前,会请求用户确认,以便用户在操作最终确定前复查。尽管如此,OpenAI也提醒,CUA并非完美,目前Operator还无法可靠处理许多复杂或专业任务,像创建详细幻灯片、管理复杂日历系统,以及与高度定制或非标准的网页界面交互等。出于谨慎考虑,对于一些任务(如银行交易),即便CUA和Operator大多能自行完成,用户仍需介入输入信用卡信息等。此外,Operator不会收集或截图任何数据,在诸如邮箱等特别敏感的网站,需要用户积极监督,以避免模型可能出现的错误。

Operator的局限性
Operator存在一些限制。它有每日及任务相关的速率限制,虽能同时执行多项任务,但存在“动态限制”,且有每日重置的总体使用限制。在当前发布阶段,出于安全考虑,Operator会拒绝执行某些任务,如发送邮件、删除日历事件等,尽管CUA具备这些能力,不过OpenAI表示未来会改变,但未给出具体时间。另外,如果遇到特别复杂的界面、密码字段或验证码检查,Operator可能会“卡住”,此时会请求用户接管操作。

AI特工的发展与安全考量
与竞争对手(如Rabbit、Google和Anthropic推出的特工)相比,OpenAI在AI特工开发上相对缓慢,这或许与该技术的安全风险有关。当AI系统能在网络上采取行动时,可能会被恶意行为者利用,引发诸如自动化网络钓鱼诈骗、DDoS攻击,或抢订演唱会门票等不良后果。特别是像ChatGPT这样广泛使用的工具,OpenAI必须采取措施防止此类滥用。

OpenAI认为Operator目前的版本足够安全,可作为研究预览版发布。Operator采用工具限制模型受恶意提示、隐藏指令和网络钓鱼攻击的影响,设有监控系统,若检测到可疑活动会暂停执行,同时通过自动化和人工审核的流程持续更新安全防护措施。

此前,OpenAI发布了Tasks,赋予ChatGPT设置提醒、定时运行提示等简单自动化功能,而Operator展现出前代虚拟助手无法企及的能力。AI特工被视为ChatGPT之后AI领域的又一重大突破,有望改变人们使用互联网和个人电脑的方式,从单纯的信息传递与处理,迈向实际行动操作。随着OpenAI推出Operator,这一愿景能否实现也将逐渐明晰。

引用链接

[1] operator.chatgpt.com: https://operator.chatgpt.com

© 版权声明

相关文章

暂无评论

暂无评论...