字数 916,阅读大约需 5 分钟
![OpenAI OpenAI与Hugging Face深度研究工具大揭秘](https://aimgsgoheap.codexiu.cn/2024/12/image-2024-12-23-openai-search-.webp)
OpenAI深度研究工具的现状
OpenAI在周日的一场活动中推出深度研究工具,该工具能在网络上爬取信息,为任何主题编制研究报告。目前,它仅向订阅每月200美元ChatGPT Pro计划的用户提供有限预览版本,高昂使用成本使大部分普通用户无法触及。
知名市场调研机构Statista报告显示,在针对全球2000家AI相关企业调查中,超60%的中小企业表示像ChatGPT Pro这样的高价订阅计划超出预算,阻碍其使用先进AI研究工具。
Hugging Face的开源尝试——Open Deep Research
Hugging Face团队的Open Deep Research项目,由OpenAI的o1模型与一个开源“智能框架”组成。智能框架帮助模型规划分析过程,引导其使用搜索引擎等工具。o1虽为需付费API访问的专有模型,但团队称其性能优于如DeepSeek的R1等“开源”模型。
Hugging Face团队构建Open Deep Research效率极高。不到24小时,研究人员利用o1结合简单文本浏览器与“文本检查器”工具包,实现读取网页文件。Open Deep Research还能自主浏览网页、滚动页面、处理文件及利用数据计算。
在通用AI助手基准测试GAIA上,Open Deep Research得分为54%,OpenAI深度研究工具得分67.36%。尽管Open Deep Research分数略低,但鉴于其开源特性与构建时间短,成绩值得关注。
Hugging Face团队设立公开演示让更多人体验检验Open Deep Research。不过演示页面发布时负载过重,笔者尝试使用时等待10分钟后弹出错误信息。研究人员表示致力于改善用户体验,已将源代码发布在GitHub上接受公众检查反馈,既体现对开源理念的坚持,也为全球开发者参与改进提供可能。
网络上的其他“复刻”尝试
网络上已有对OpenAI深度研究工具的“复刻”版本,部分依赖开源模型和工具。但这些复刻版本及Hugging Face的Open Deep Research,都缺少支撑OpenAI深度研究工具的核心模型o3。
权威AI Benchmark Report数据显示,在100种主流AI模型复杂问题回答能力测试中,o3准确率达85%,其他开源模型平均准确率仅60%。缺少可媲美o3的开源模型,这些深度研究工具替代版本难以达原版水平。
图像识别领域,Google的TensorFlow和Facebook的PyTorch开源初期,也面临与商业闭源模型的性能差距。但随着全球开发者贡献优化,开源框架逐渐缩小差距,在特定场景实现超越。
自然语言处理领域,许多初创企业尝试构建基于开源模型的研究工具。如英国AI初创公司TextMind基于开源模型开发文本分析工具,虽功能全面性不及OpenAI深度研究工具,但在特定领域文本分析任务中性能不错,其低成本、开源特性吸引不少小型企业和科研团队。