阿里巴巴推出QwQ-32B-Preview:挑战OpenAI的o1推理模型

AI头条2个月前发布 freeAI
0
阿里巴巴推出QwQ-32B-Preview:挑战OpenAI的o1推理模型

Alibaba

阿里巴巴近期发布了一款被称为“推理”人工智能(AI)模型的QwQ-32B-Preview,这款模型是少数能够与OpenAI的o1模型相抗衡的产品之一,并且它是首个以宽松许可方式提供的模型。由阿里巴巴的Qwen团队开发的QwQ-32B-Preview包含32.5亿个参数,可以处理长达约32,000词的提示;它在某些基准上比OpenAI发布的o1-preview和o1-mini两款推理模型表现更佳。

根据阿里巴巴的测试,QwQ-32B-Preview在AIME和MATH测试中击败了OpenAI的o1模型。AIME使用其他AI模型来评估一个模型的表现,而MATH则是一系列文字问题的集合。

QwQ-32B-Preview可以解决逻辑难题并回答具有挑战性的数学问题,这得益于其“推理”能力。不过,它并非完美无缺。阿里巴巴在其博客文章中指出,该模型可能会意外切换语言、陷入循环,并且在需要‘常识推理’的任务上表现不佳。

不同于大多数AI系统,QwQ-32B-Preview和其他推理模型有效地自我校验。这有助于它们避免通常会困扰模型的一些陷阱,尽管这意味着它们可能需要更长的时间来得出解决方案。类似于o1,QwQ-32B-Preview通过任务进行推理,计划未来步骤并执行一系列动作,帮助模型推导出答案。

QwQ-32B-Preview可以在AI开发者平台Hugging Face上运行和下载,它的行为似乎与中国实验室最近发布的DeepSeek推理模型相似,在涉及某些政治话题时表现得比较谨慎。

 

© 版权声明

相关文章

暂无评论

暂无评论...