Loading...

生数科技发布高可控视频大模型 Vidu Q1：可精准调整所有动作行为

AI前沿资讯5天前发布 GOODNAV.NET

230 0 0

GoodNav 3 月 29 日报道，清华大学人工智能研究院副院长、生数科技的创始人及首席科学家朱军今天发布了高可控视频大模型 Vidu Q1，并声称这是业内首个高可控 AI 视频大模型。

根据官方信息，Vidu Q1 在多个方面取得了显著成果，包括多主体细节可控（尤其是在动作和布局方面）、音效同步可控以及画质提升等。以多主体细节可控为例，基于语义指令，Vidu Q1通过引入参考图的视觉指令，能够支持对场景中多主体的位置、大小和运动轨迹等属性进行更精确的控制，并且能够精准调整所有动作行为（如出场、退场、坐立姿态和行动路线）。

生数科技发布高可控视频大模型 Vidu Q1：可精准调整所有动作行为

该模型支持音效同步可控功能，可以确保随着视频环境和画面切换，Vidu Q1 能够生成相应的音效，同时还可精确控制每段音效的时长以及音频出现的时间点，例如0-2秒风声、3-5秒雨声等。

# AI前沿资讯

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

2025 年考研数学一得 126 分，智谱深度推理模型 GLM-Zero 预览版上线

GoodNav.net

1K

得州一私立学校引入“AI 导师”：学生更轻松，成绩跻身全美前 2%

GoodNav.net

275

字节即梦 AI 图片模型 2.1 上线，号称“一句话生成海报”

GoodNav.net

935

国仪量子发布全球首个 AI 电子顺磁共振波谱仪，精准度打破世界纪录

GoodNav.net

1.2K

谷歌安卓版 Gemini AI 现支持浮动 / 分屏操作，三星 Galaxy Z Fold6 折叠手机限时独享

GoodNav.net

1.4K

N代码显示谷歌正在开发儿童版 Gemini：能编故事，还能辅导作业

GoodNav.net

325

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2024 goodnav.net All Rights Reserved