Tiny-R1-32B-Preview:小模型大潜能,革新推理领域

字数 1272,阅读大约需 7 分钟

Tiny-R1-32B-Preview:小模型大潜能,革新推理领域
360公司是中国领先的互联网和移动安全产品及服务提供商,致力于提供包括安全软件、智能硬件、人工智能等多个领域的解决方案和服务。

模型发布与性能突破

2月24日,360智脑团队与北京大学联合研发的中等量级推理模型 Tiny-R1-32B-Preview 正式发布,在人工智能领域引起广泛关注。该模型以仅5%的参数量,成功逼近了 Deepseek-R1-671B 的满血性能,展现了小模型在高效推理领域的巨大潜力。

数学领域表现卓越

Tiny-R1-32B-Preview 在数学领域的推理能力尤为突出。在 AIME2024评测中,该模型取得了78.1分的成绩,与原版 R1模型的79.8分相当接近,远超 Deepseek-R1-Distill-Llama-70B 的70.0分。这一成绩不仅展示了 Tiny-R1-32B-Preview 在数学推理方面的强大能力,也证明了小模型在高效推理领域的巨大潜力。

编程与科学领域全面领先

在编程和科学领域,Tiny-R1-32B-Preview 同样表现出色。在 LiveCodeBench 测试中,该模型取得了61.6分的成绩,而在 GPQA-Diamond 测试中则取得了65.0分的成绩。这些成绩全面领先于当前最佳开源70B模型 Deepseek-R1-Distill-Llama-70B,进一步巩固了 Tiny-R1-32B-Preview 在中等量级推理模型领域的领先地位。

技术创新与成本降低

Tiny-R1-32B-Preview 的突破不仅在于性能上的卓越表现,更在于通过仅需5%的参数量大幅降低了推理成本,实现了效率的跃迁。这一成果得益于其背后的核心技术——“分治-融合”策略。研究团队基于 DeepSeek-R1生成海量领域数据,分别训练了数学、编程、科学三大垂直领域的模型。随后,通过 Arcee 团队的 Mergekit 工具进行智能融合,突破了单一模型的性能上限,实现了多任务的均衡优化。这种创新的技术路径不仅提升了模型的性能,也为未来推理模型的发展提供了新的思路。

开源社区的支持与技术普惠

360智脑团队和北京大学的联合研发团队表示,Tiny-R1-32B-Preview 的成功离不开开源社区的支持。该模型受益于 DeepSeek-R1蒸馏、DeepSeek-R1-Distill-32B 增量训练以及模型融合等技术。为了推动技术普惠,研发团队承诺将公开完整的模型仓库,包括技术报告、训练代码及部分数据集。目前,模型仓库已上线至 Hugging Face 平台,地址为 https://huggingface.co/qihoo360/TinyR1-32B-Preview。这一举措将有助于促进人工智能领域的技术交流与共享,推动整个行业的发展。

中等量级推理模型的突破

2月24日,360智脑团队与北京大学联合研发的中等量级推理模型 Tiny-R1-32B-Preview 正式发布,这一发布在人工智能领域引起了广泛关注。该模型仅以5%的参数量,成功逼近了 Deepseek-R1-671B 的满血性能,这在小模型高效推理领域无疑是一次巨大的飞跃。

关键领域表现卓越

Tiny-R1-32B-Preview 在多个关键领域的表现尤为突出:

  • 数学领域:在 AIME2024评测 中,Tiny-R1-32B-Preview 取得了78.1分的成绩,这与原版 R1模型的79.8分相当接近,远超 Deepseek-R1-Distill-Llama-70B 的70.0分。
  • 编程领域:在 LiveCodeBench 测试中,该模型取得了61.6分的成绩。
  • 科学领域:在 GPQA-Diamond 测试中,Tiny-R1-32B-Preview 取得了65.0分的成绩。

这些成绩全面领先于当前最佳开源70B模型 Deepseek-R1-Distill-Llama-70B,证明了 Tiny-R1-32B-Preview 在性能上的卓越表现。

“分治-融合”策略的创新应用

这一突破背后的核心技术是“分治-融合”策略。研究团队首先基于 DeepSeek-R1 生成海量领域数据,分别训练了数学、编程、科学三大垂直领域的模型。随后,通过 Arcee 团队的 Mergekit 工具 进行智能融合,突破了单一模型的性能上限,实现了多任务的均衡优化。这种创新的技术路径不仅提升了模型的性能,也为未来推理模型的发展提供了新的思路。

开源承诺与社区支持

Tiny-R1-32B-Preview 的成功离不开开源社区的支持。该模型受益于 DeepSeek-R1蒸馏、DeepSeek-R1-Distill-32B 增量训练 以及模型融合等技术。为了推动技术普惠,研发团队承诺将公开完整的模型仓库,包括技术报告、训练代码及部分数据集。这一承诺将有助于促进人工智能领域的交流与合作,推动技术的进一步发展。

模型仓库上线

目前,Tiny-R1-32B-Preview 的模型仓库已上线至 Hugging Face 平台,地址为 https://huggingface.co/qihoo360/TinyR1-32B-Preview。这一举措将使得更多的开发者和研究人员能够访问和使用该模型,进一步推动人工智能技术的应用和发展。

© 版权声明

相关文章

暂无评论

暂无评论...