字数 950,阅读大约需 5 分钟
![OpenAI OpenAI大动作!o3-mini模型思维过程揭秘](https://aimgsgoheap.codexiu.cn/2024/12/image-2024-12-23-openai-search-.webp)
OpenAI进一步揭示o3 – mini模型的思维过程
近期,在竞争对手压力下,OpenAI对其最新AI模型o3 – mini传达“思维”过程的方式做出改变。周四,OpenAI宣布,ChatGPT[1]的免费和付费用户将看到更新后的“思维链”,展示该模型更多“推理”步骤及得出答案的过程。使用o3 – mini的ChatGPT高级订阅用户在“高推理”配置中,也会看到更新后的结果展示。
OpenAI发言人表示:“为o3 – mini引入更新后的[思维链],旨在让人们更易理解模型思考方式。通过这一更新,用户能追踪推理过程,对回复更清晰且有信心。”
像o3 – mini这样的推理模型,在给出结果前会全面自我事实核查,避免一些常见陷阱,但得出解决方案时间会稍长,通常多出几秒到几分钟。例如,DeepSeek的R1模型作为类似“推理”模型,会展示完整思维过程,许多AI研究人员认为这种方式更可取。推理步骤除便于研究外,在某些情况下还能提供更好用户体验,有助于判断模型是否正确。
此前,OpenAI因竞争等原因,不展示o3 – mini及其前身o1和o1 – mini的完整推理步骤,用户只能看到有时存在错误的摘要。此次虽仍未展示完整推理步骤,但OpenAI表示已“找到平衡”:o3 – mini可“自由思考”,然后将“想法”组织成更详细摘要。OpenAI发言人还提到:“为提高清晰度和安全性,增加额外后处理步骤,模型审查原始思维链,去除不安全内容,简化复杂想法。此外,该步骤使非英语用户能以母语接收思维链,创造更友好体验。”
上周,在Reddit的AMA活动中,OpenAI首席产品官Kevin Weil暗示了这一变化。他表示正在努力展示更多内容,展示模型思维过程很快会实现。
从行业报告看,AI推理模型的透明性一直受关注。根据相关机构发布的《2024 – 2025全球人工智能推理模型发展报告》,超过70%的AI研究人员认为,模型推理过程透明性对可解释性和安全性至关重要。在实际应用中,透明推理过程有助于企业和开发者理解模型决策,在金融风控、医疗诊断等关键领域放心应用AI技术。
类似的,谷歌的BARD模型早期推理过程也不够透明。随着竞争加剧和用户对可解释性需求提升,谷歌对其多次优化,逐步增加推理过程展示。这不仅提升了用户信任度,还让谷歌在竞争中保持优势。据统计,优化后的一个季度内,BARD模型用户活跃度提升,市场份额增长。
在国内,除DeepSeek的R1模型,字节跳动的云雀模型也在探索展示推理过程。云雀模型引入可视化技术,以图形化方式呈现复杂推理逻辑,提升用户对模型决策的理解,为其他模型发展提供新思路。