字数 1213,阅读大约需 7 分钟

昆仑万维发布Matrix – Zero世界模型:开启空间智能新时代
2025年2月14日,在人工智能领域持续深耕的昆仑万维集团[1],正式向全球发布了备受瞩目的Matrix – Zero世界模型。这一发布具有里程碑意义,为中国在空间智能领域注入强心剂,标志着中国在该领域迈出坚实且重要的一步。
Matrix – Zero世界模型:双剑合璧,重塑数字内容创作
Matrix – Zero并非单一模型,而是包含两款极具创新性的子模型:3D场景生成大模型和可交互视频生成大模型。这两款子模型旨在全方位重塑数字内容创作模式,推动影视制作、游戏开发、具身智能等多个行业创新发展。
相关行业报告显示,全球数字内容创作市场规模近年来持续增长。影视制作、游戏开发等领域对创新数字内容创作技术需求迫切,Matrix – Zero的出现顺应了这一行业发展趋势。
3D场景生成大模型:从平面到立体的神奇跨越
Matrix – Zero的3D场景生成大模型能将用户输入的二维图片转化为可自由探索的真实3D场景。无论是写实、卡通还是奇幻风格图片,都可作为创作3D场景的素材,还支持风格迁移。创作者能按需求将一种风格图片转化为另一种风格的3D场景。
该模型具备动态场景生成能力。技术上,通过场景布局生成模块和纹理生成模块,巧妙结合可微渲染和扩散模型技术。生成的3D场景不仅全局保持一致,动态表现也极为合理。例如,输入一张“城堡的花园一角”图片,模型能生成360度环视后场景不变的3D场景,支持用户长距离、大范围自由探索。
实际应用中,这一技术为3D游戏建模和具身智能模拟场景搭建提供高效解决方案。传统3D游戏场景建模需耗费大量人力和时间,借助该模型,游戏开发者能在短时间内快速生成高质量3D场景,大幅缩短游戏开发周期。
可交互视频生成大模型:赋予用户视频交互新体验
Matrix – Zero的可交互视频生成大模型同样亮点突出。它以用户输入为核心驱动,创新性结合先进的生成式视频模型和自主研发的用户交互模块,实现视频内容中视角移动的精确控制。用户通过键盘或鼠标输入,就能轻松控制视频视角和运动轨迹,实现前后左右移动及视角变换等操作。
模型内部包含离散运动控制模块、连续视角控制模块、3D场景位置追踪模块和滑动窗口机制,各模块相互协作,确保用户交互体验的流畅性和连贯性。
在影视制作领域,可交互视频生成技术有巨大应用潜力。观众不再被动观看视频内容,可通过操作探索视频不同视角和情节发展,提升参与度和沉浸感,为影视行业带来全新创作思路和商业模式。
昆仑万维:AI领域的持续探索与突破
昆仑万维是中国AI领域的领军企业,在追求通用人工智能的道路上从未停歇。过去三年,昆仑万维在视觉多模态、深度学习等关键技术方向成果显著。通过持续自主研发,构建了包括天工AI搜索、Mureka音乐创作平台、SkyReels短剧平台等在内的完整AI矩阵。
Matrix – Zero的推出,是昆仑万维在AI领域的又一次重大突破,也是其AI业务矩阵的重要补充。它巩固了昆仑万维在空间智能领域的领先地位,为公司未来发展奠定基础。