阶跃星辰Step-Video-TI2V：图生视频新时代的开创者

字数 1233，阅读大约需 7 分钟

深入探索阶跃星辰Step-Video-TI2V：开启图生视频新时代！

作为人工智能领域的一次重大突破，上海阶跃星辰智能科技有限公司（以下简称阶跃星辰）近日宣布开源其最新的图生视频模型——Step-Video-TI2V。这一创新成果基于30B参数的Step-Video-T2V模型进化而来，不仅能够生成高质量、5秒长、540P分辨率、包含102帧的视频，更以其独特的运动幅度和镜头运动可控性脱颖而出，为图生视频领域带来了全新的可能。

核心技术突破：图像与视频的完美融合

Step-Video-TI2V在技术上实现了两大关键突破。首先，为了提高生成视频与原图的一致性，该模型采用了一种更直接的方式，将图像对应的向量表示与DiT（Diffusion Transformer）第一帧对应的向量表示直接进行channel维度的拼接。这种创新的方法确保了生成的视频与输入图片在视觉上的高度一致，避免了传统cross-attention方法可能带来的不一致性问题。

其次，Step-Video-TI2V通过引入AdaLN（Adaptive Layer Normalization）模块，实现了对视频动态性的精准控制。用户在生成视频时可以指定不同的运动级别，从而平衡视频的动态性、稳定性和一致性。这一功能为创作者提供了极大的灵活性，使他们能够根据具体需求调整视频的动感程度，无论是需要流畅自然的动画效果，还是追求电影级的震撼视觉体验，都能轻松实现。

专项优化：主体动作与镜头运动的精准呈现

在Step-Video-TI2V的开发过程中，阶跃星辰团队还对主体动作和镜头运动进行了专项精准标注。这一优化进一步提升了模型在主体动态性和运镜效果上的表现，使得生成的视频更加生动、专业。无论是人物的细微动作，还是复杂场景中的镜头切换，Step-Video-TI2V都能以极高的精度进行捕捉和呈现，为创作者提供了强大的工具支持。

多尺寸适应：满足多样化创作需求

Step-Video-TI2V还具备出色的多尺寸适应能力，支持横屏、竖屏和方屏等多种屏幕尺寸的图生视频生成。这一特性使其能够满足不同平台、不同应用场景的多样化需求，无论是动画制作、短视频创作，还是其他形式的视觉内容生产，都能提供强有力的支持。

动漫效果优异：为动画创作注入新活力

特别值得一提的是，Step-Video-TI2V在动漫类任务上的表现尤为突出。其独特的技术优势和专项优化，使得该模型非常适合动画创作和短视频制作等应用场景。创作者可以利用Step-Video-TI2V生成高质量的动漫视频，为观众带来全新的视觉体验。

行业影响与前景展望

Step-Video-TI2V的发布，标志着图生视频技术进入了一个新的发展阶段。其强大的功能和灵活的可控性，将为创作者提供更多的创作可能性，推动视觉内容生产领域的创新与发展。同时，作为一款开源模型，Step-Video-TI2V也将吸引更多的开发者和研究者参与到相关技术的研究与应用中来，共同推动人工智能技术的进步。

体验与了解

想要亲自体验Step-Video-TI2V的强大功能，并了解更多技术细节，可以访问阶跃星辰的官方网站https://yuewen.cn/videos。同时，阶跃星辰还在GitHub上发布了Step-Video-TI2V的开源代码和模型权重，感兴趣的开发者可以前往https://github.com/stepfun-ai/Step-Video-TI2V进行查看和使用。此外，阶跃星辰还提供了与ComfyUI集成的版本，方便用户在熟悉的环境中进行创作，相关代码和文档可以在https://github.com/stepfun-ai/ComfyUI-StepVideo找到。

随着Step-Video-TI2V的推出，我们有理由相信，图生视频技术将迎来更加广阔的发展空间，为视觉内容创作带来更多的惊喜和可能性。让我们共同期待这一技术的未来发展，以及它将为我们带来的精彩视觉体验。

# AI快讯 # AI视频

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...