字数 967,阅读大约需 5 分钟

华为昇腾与阶跃星辰合作推出开源多模态模型:Step-Video与Step-Audio的技术创新与行业影响
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型,这一举措为开发者和企业用户提供了更为强大的AI工具,推动了多模态AI模型的应用场景拓展和行业技术进步。
Step-Video:全球最大开源视频生成模型
Step-Video-T2V 是一款参数量高达300亿的视频生成模型,能够直接生成204帧、540P分辨率的高质量视频。在指令遵循、运动平滑性、物理合理性以及美感等方面,Step-Video的表现超越了市场上现有的顶尖开源视频模型。这一技术创新为视频内容创作、影视制作等领域带来了革命性的变化,使得高质量视频生成变得更加高效和便捷。
Step-Audio:业内首款多风格语音生成大模型
Step-Audio 则是业内首款能够生成多种情感、方言、语言、唱腔和个性化风格的语音的大模型。这一技术的发布标志着AI语音交互领域的一次重要突破,为智能客服、虚拟助手、游戏角色配音等领域提供了更加丰富和自然的语音交互体验。
华为昇腾CANN异构计算架构与昇腾服务器的关键作用
这些模型是基于华为昇腾CANN异构计算架构和昇腾服务器进行适配的,这使得开发者和企业用户可以在魔乐社区中便捷地下载和体验这些模型。华为昇腾的强大计算能力和高效的异构计算架构为模型的运行提供了有力支撑,确保了模型在实际应用中的性能和稳定性。
魔乐社区的免费算力支持与开源生态的构建
为了进一步降低使用门槛,魔乐社区还提供免费算力支持,让用户可以在线进行模型推理,而无需复杂的环境搭建,快速验证他们的AI方案。这一举措大大降低了开发者和企业用户的成本,加速了AI技术的落地和应用。
阶跃星辰的开源模型受到了多个行业标杆企业的关注,包括天数智芯、阿里云、火山引擎、TCL等各行各业的厂商已纷纷接入这一开源生态。这种广泛的合作和生态构建为多模态AI模型的应用提供了更加广阔的舞台,也为整个行业的技术进步注入了新的动力。
未来展望:阶跃星辰的产品线规划
未来,阶跃星辰计划在3月份推出新的图生视频模型,进一步丰富其产品线。这一规划表明阶跃星辰在多模态AI领域的持续创新和投入,也为行业的发展带来了更多期待。
华为昇腾与阶跃星辰的合作不仅拓展了多模态AI模型的应用场景,也为开发者提供了更为强大的工具,推动了整个行业的技术进步。随着这些开源模型的不断优化和完善,我们可以预见到多模态AI技术将在更多领域发挥重要作用,为人类社会带来更多便利和创新。