ChatGPT深度研究重磅发布,革新信息获取模式

字数 1308,阅读大约需 7 分钟

ChatGPT深度研究重磅发布,革新信息获取模式
OpenAI是一个人工智能研究实验室和技术公司,致力于以安全且有益的方式推进数字智能,开发了如ChatGPT等知名AI语言模型,业务涵盖AI技术研发、模型训练、应用开发等多个领域,旨在推动人工智能技术的发展并探索其对社会的潜在影响,将其应用于自然语言处理、对话系统、文本生成等诸多场景。

功能特性与使用方式

ChatGPT深度研究旨在满足用户对多网站及其他来源信息进行深入考量的需求,而非仅提供快速答案或总结。目前,该功能已面向ChatGPT Pro[1]用户开放,每月限100次查询。OpenAI计划约一个月后向Plus和Team用户推出,随后是Enterprise用户。此次发布存在地域限制,OpenAI暂未公布针对英国、瑞士及欧洲经济区ChatGPT用户的发布时间。

使用时,用户只需在编辑器中选择“深度研究”,输入查询内容,还可选择附加文件或电子表格(当前仅支持网页端,本月晚些时候将集成到移动和桌面应用程序)。深度研究回答问题可能需要5到30分钟,搜索完成后用户将收到通知。当前,其输出仅为文本形式,OpenAI计划很快添加嵌入图像、数据可视化及其他“分析”输出。此外,未来还将支持连接“更专业的数据来源”,包括“订阅型”和内部资源。

准确性与技术支撑

AI技术容易出现幻觉和其他错误,在深度研究场景中,这些问题可能尤为严重。为此,OpenAI表示,每次ChatGPT深度研究的输出都将“完整记录,包含清晰的引用和思考总结,便于参考和验证信息”。

为提高深度研究的准确性,OpenAI采用了其近期发布的o3“推理”AI模型的特殊版本,该版本通过强化学习,在“需要使用浏览器和Python工具的现实世界任务”中进行训练。强化学习通过试错“教导”模型实现特定目标,随着模型接近目标,会获得虚拟“奖励”,从而提升执行任务的能力。OpenAI称,此版本的o3模型“针对网页浏览和数据分析进行了优化,能够利用推理搜索、解释和分析互联网上大量的文本、图像和PDF,根据遇到的信息灵活调整……该模型还能够浏览用户上传的文件,使用Python工具绘制和迭代图表,在回复中嵌入生成的图表和网站图像,并引用来源中的特定句子或段落”。

OpenAI使用“人类最后考试”(Humanity’s Last Exam)对ChatGPT深度研究进行了测试,该考试包含3000多个不同学术领域的专家级问题。驱动深度研究的o3模型准确率达到26.6%,“人类最后考试”旨在比其他基准测试更具挑战性,以跟上模型的发展。据OpenAI称,深度研究o3模型的成绩远超Gemini Thinking(6.2%)、Grok – 2(3.8%)和OpenAI自身的GPT – 4o(3.3%)。

局限性与潜在影响

OpenAI指出ChatGPT深度研究存在局限性,有时会出现错误和不正确的推断。该功能可能难以区分权威信息与谣言,且常常无法表明自身对某些内容的不确定性,在报告和引用中也可能出现格式错误。

对于担心生成式AI对学生或在线信息搜索者产生影响的人来说,这种深入且引用规范的输出,可能比没有引用的简单欺骗性聊天机器人总结更具吸引力。

从行业数据来看,过去一年中,全球范围内对AI研究辅助工具的需求增长了30%,其中深度研究相关功能的需求占比达到15%。这表明OpenAI此次推出的ChatGPT深度研究智能体顺应了市场对于更精准、深入的AI研究辅助工具的需求趋势。而在相似的公司案例方面,微软的Bing AI也在不断强化其搜索和研究功能,试图为用户提供更全面的信息支持。但与OpenAI此次推出的深度研究功能不同,Bing AI更侧重于整合网络资源,在引用和深度分析的规范性上,目前尚未达到ChatGPT深度研究宣称的标准。

另外,根据针对全球AI研发投入的统计,去年一年,OpenAI、谷歌、微软等头部企业在AI技术研发上的总投入就超过了100亿美元,其中很大一部分用于提升AI在复杂任务处理,如深度研究方面的能力。这也从侧面反映出该领域竞争的激烈程度以及市场对相关功能的高度重视。

引用链接

[1] ChatGPT Pro: https://openai.com/pricing

© 版权声明

相关文章

暂无评论

暂无评论...