Loading...

阶跃星辰 Step-Video-TI2V 图生视频模型开源:运动幅度和镜头运动可控

GoodNav 3 月 20 日报道,今年 2 月,阶跃星辰开源了两款 Step 系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。今天,阶跃星辰又推出了图生视频模型——Step-Video-TI2V,这是一个基于 30B 参数的 Step-Video-T2V 训练的图生视频模型,支持生成 102 帧、5 秒、540P 分辨率的视频,具备运动幅度和镜头运动可控的两个核心特点,同时具备一定的特效生成能力。

阶跃星辰 Step-Video-TI2V 图生视频模型开源:运动幅度和镜头运动可控

阶跃星辰表示,与现有的开源图生视频模型相比,Step-Video-TI2V 在参数规模上提升了该领域研究的上限,其运动幅度可控的能力则能平衡图生视频生成结果的动态性和稳定性,为创作者提供了更加灵活的选择。

同时,Step-Video-TI2V 已成功适配了华为昇腾计算平台,并已在魔乐社区(Modelers)上线。

以下是 Step-Video-TI2V 的核心特点:

1、运动幅度可控:动态与稳定自由切换

Step-Video-TI2V 支持控制视频的“运动幅度(motion)”,能够平衡图生视频内容的运动性和稳定性。不论是静态稳定的画面,还是高动态的动作场景,都能满足创作者的需求。

2、多种运镜控制

除了对镜头内主体的运动进行控制,Step-Video-TI2V 还支持对多种运镜手法的理解,可以精确控制生成视频中的镜头运动,实现大片级运镜效果。从基本的推拉摇移、升降,到各种复杂的电影级运镜效果,都可以轻松驾驭。

3、动漫效果尤佳

Step-Video-TI2V 在动画类任务上的表现尤为突出,非常适合动画创作、短视频制作等应用场景。

4、支持多尺寸生成

Step-Video-TI2V 可以生成多种尺寸的图生视频,无论是横屏的宽阔视野、竖屏的沉浸体验,还是方屏的经典复古风格,都能轻松应对。用户可以根据不同的创作需求和平台特性,自由选择图片尺寸,而无需担心画面变形或比例失调的问题。

目前,Step-Video-TI2V 模型已经正式开源,阶跃 AI 网页版和 App 端均已上线。

此外,Step-Video-TI2V 现已初步具备一些特效生成能力,未来,阶跃星辰将通过 LoRA 等技术继续挖掘模型的特效潜力。

模型及技术报告链接:

GitHub:

https://github.com/stepfun-ai/Step-Video-TI2V

Github-ComfyUI:

https://github.com/stepfun-ai/ComfyUI-StepVideo

技术报告:

https://arxiv.org/abs/2503.11251

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...