2025年1月22日,上海阶跃星辰智能科技有限公司正式推出升级版的视频生成模型——Step-Video V2。此次升级带来了显著的技术突破和功能升级,使得Step-Video在真实世界模拟能力上得到了显著增强。

Step-Video V2在多个核心技术领域实现了优化与创新。首先,该版本采用更高效的VAE模型,通过时空的高效压缩,在保持重构质量的同时,大幅降低了计算复杂度,提高了生成效率。其次,Step-Video V2对DiT架构进行了深度优化,并引入强化学习算法,进一步提升视频生成的流畅度和细节表现力。此外,该版本整合了公司自研的多模态理解大模型和视频知识库,能够更精确地描述视频内容和镜头语言,生成更逼真的视频。

微信截图_20250123090916.png

在实际应用中,Step-Video V2展现出卓越的复杂运动生成能力,无论是芭蕾舞、空手道,还是羽毛球等场景,都能流畅地呈现动态画面。同时,该模型在人物表情捕捉方面表现出色,能够细腻地呈现真实人物或虚构角色的神态和光影效果。此外,Step-Video V2还支持丰富的镜头语言,包括推、拉、摇、移等多种运动方式,以及不同景别之间的切换,为视频创作提供了更多创意空间。

特别值得一提的是,Step-Video V2新增了基础文字生成功能,能够将文字自然地融入视频内容,生成效果显著优于上一代模型。这一功能的加入,进一步拓宽了视频生成的应用范围。

目前,Step-Video V2已在跃问网页端(https://yuewen.cn/videos)开放试用申请,用户可以体验升级后的强大功能。

此次升级不仅代表着阶跃星辰在视频生成技术领域的进步,同时也为创作者提供了更强大的工具,推动视频创作迈向新阶段。