标签:大模型训练

小米大模型团队引领智能听觉新时代:音频理解技术的重大突破

小米大模型团队在MMAU评测中以64.5%的准确率荣登榜首,采用创新的强化学习算法GRPO,展示了在音频理解领域的深厚实力。研究表明隐式推理相较于显式思维链能更...

深度学习系统ColossalAI:降低大型AI模型的训练成本,提高训练速度,并增强模型的可访问性

本文介绍了ColossalAI,一个统一的深度学习系统,具有丰富的并行策略、用户友好的工具、异构内存管理等特点,可降低大型AI模型的训练成本,提高训练速度,还...