OpenAI与Hugging Face深度研究工具大揭秘

字数 916，阅读大约需 5 分钟

OpenAI深度研究工具的现状

OpenAI在周日的一场活动中推出深度研究工具，该工具能在网络上爬取信息，为任何主题编制研究报告。目前，它仅向订阅每月200美元ChatGPT Pro计划的用户提供有限预览版本，高昂使用成本使大部分普通用户无法触及。

知名市场调研机构Statista报告显示，在针对全球2000家AI相关企业调查中，超60%的中小企业表示像ChatGPT Pro这样的高价订阅计划超出预算，阻碍其使用先进AI研究工具。

Hugging Face的开源尝试——Open Deep Research

Hugging Face团队的Open Deep Research项目，由OpenAI的o1模型与一个开源“智能框架”组成。智能框架帮助模型规划分析过程，引导其使用搜索引擎等工具。o1虽为需付费API访问的专有模型，但团队称其性能优于如DeepSeek的R1等“开源”模型。

Hugging Face团队构建Open Deep Research效率极高。不到24小时，研究人员利用o1结合简单文本浏览器与“文本检查器”工具包，实现读取网页文件。Open Deep Research还能自主浏览网页、滚动页面、处理文件及利用数据计算。

在通用AI助手基准测试GAIA上，Open Deep Research得分为54%，OpenAI深度研究工具得分67.36%。尽管Open Deep Research分数略低，但鉴于其开源特性与构建时间短，成绩值得关注。

Hugging Face团队设立公开演示让更多人体验检验Open Deep Research。不过演示页面发布时负载过重，笔者尝试使用时等待10分钟后弹出错误信息。研究人员表示致力于改善用户体验，已将源代码发布在GitHub上接受公众检查反馈，既体现对开源理念的坚持，也为全球开发者参与改进提供可能。

网络上的其他“复刻”尝试

网络上已有对OpenAI深度研究工具的“复刻”版本，部分依赖开源模型和工具。但这些复刻版本及Hugging Face的Open Deep Research，都缺少支撑OpenAI深度研究工具的核心模型o3。

权威AI Benchmark Report数据显示，在100种主流AI模型复杂问题回答能力测试中，o3准确率达85%，其他开源模型平均准确率仅60%。缺少可媲美o3的开源模型，这些深度研究工具替代版本难以达原版水平。

图像识别领域，Google的TensorFlow和Facebook的PyTorch开源初期，也面临与商业闭源模型的性能差距。但随着全球开发者贡献优化，开源框架逐渐缩小差距，在特定场景实现超越。

自然语言处理领域，许多初创企业尝试构建基于开源模型的研究工具。如英国AI初创公司TextMind基于开源模型开发文本分析工具，虽功能全面性不及OpenAI深度研究工具，但在特定领域文本分析任务中性能不错，其低成本、开源特性吸引不少小型企业和科研团队。

# AI快讯 # OpenAI

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

OpenAI与Hugging Face深度研究工具大揭秘

OpenAI深度研究工具的现状

Hugging Face的开源尝试——Open Deep Research

网络上的其他“复刻”尝试

重磅！Figure弃用OpenAI，全力自研模型

欧盟发布AI禁用指南，AI发展迎来新挑战

相关文章

暂无评论