字数 656,阅读大约需 4 分钟

OpenAI推出全新AI助手“Operator”,助力自动化网页操作
近日,OpenAI[1]再次展现了其在人工智能领域的创新实力,推出了一款全新的AI助手“Operator”,为用户的网页操作带来了前所未有的便利。
根据OpenAI于1月23日发布的博文,“Operator”现阶段仅向美国的Pro版订阅用户开放,未来将逐步扩展至Plus、Team和Enterprise用户。
“Operator”的核心亮点在于其强大的Computer – Using Agent(CUA)模型。该模型结合了GPT – 4卓越的视觉处理能力以及通过强化学习获得的高级推理能力,使其能够轻松应对图形用户界面(GUI)。也就是说,无论是复杂的表单填写、繁琐的杂货订购,还是制作表情包等重复性工作,用户都无需再亲自操作。只需在operator.chatgpt.com上输入简单指令,AI助手就会在后台自动完成任务。
从技术层面深入剖析,“Operator”不仅能够像人类一样“看到”浏览器中的内容,还能通过鼠标和键盘与网页进行全面交互,真正实现了无缝操作。用户提供必要指示后,AI会通过屏幕截图等方式“理解”任务需求,并迅速执行操作,极大地简化了以往繁琐的操作流程。
行业报告显示,随着人工智能技术的不断发展,智能助手在提高工作效率和生活质量方面的作用日益显著。OpenAI首席产品官凯文·韦尔(Kevin Weil)于1月21日在瑞士达沃斯举行的论坛上也曾表示,2025年是AI智能体之年,ChatGPT将从一个智能问答工具转变为能在现实世界中为用户完成具体任务的“智能助手”。“Operator”的推出,无疑是OpenAI在这一方向上的重要实践。
在未来,OpenAI计划将“Operator”功能进一步整合到ChatGPT中,届时更多用户将能够享受到这种便捷的浏览器任务自动化体验。这不仅将为用户节省大量时间和精力,使他们能够将更多的注意力集中在更具创意和战略性的工作上,也有望引领人工智能在自动化操作领域的新潮流,为行业发展树立新的标杆。
引用链接
[1]
OpenAI: https://openai.com/