Runway 发布 AI 视频生成模型 Gen-4：可保持角色、场景高度一致性

250 0 0

GoodNav 4 月 1 日报道，人工智能（AI）初创公司 Runway 于本周一推出了其新开发的 AI 视频生成模型 Gen-4。该公司据称，这是迄今为止保真度最高的 AI 驱动视频生成工具之一。

新发布的 Gen-4 模型现已开始向 Runway 的个人及企业用户进行推送。据 Runway 介绍，该模型的主要优势在于能够在不同的视频场景中保持角色、地点和物体的一致性，从而维持“连贯的世界环境”，并且可以从不同的视角和位置重新生成场景元素。

Runway 在其官方博客中表示：“Gen-4 能够高效利用视觉参考资料，同时结合用户的文本指令，创造出风格、主体、地点等元素保持一致的新图像和视频，整个过程无需进行模型微调或额外的训练。”

Runway 公司获得了包括 Salesforce、谷歌和英伟达在内的著名投资机构的支持，专注于提供包括 Gen-4 在内的一系列 AI 视频制作工具。然而，在这个竞争激烈的 AI 视频生成领域，Runway 面临着来自 OpenAI 和谷歌等科技巨头的强大挑战。为了在市场上占据一席之地，Runway 采取了差异化的竞争策略，除了与一家好莱坞大型电影制片厂签署合作协议，还特别拨款数百万美元，资助那些使用 AI 技术进行视频创作的电影项目。

具体来说，关于 Gen-4 的功能，Runway 表示，用户只需提供角色的参考图像，模型即能在不同光照条件下生成外观均匀一致的角色。在构建特定场景时，用户可以上传主体的图像，并通过文字描述明确其希望生成的镜头构图要求。

Runway 在博客中进一步强调：“Gen-4 在生成具有高度动态感和逼真运动效果的视频方面表现非常出色，同时在主体、物体和风格的一致性，遵循用户指令的准确性以及对现实世界规律的理解方面，都达到了同类产品的顶尖水平。”公司还宣称，“Runway Gen-4 的发布，标志着视觉生成模型在模拟真实世界物理规律的能力上取得了重要里程碑。”

与当前所有的视频生成模型一样，Gen-4 也是基于海量的视频数据进行训练而成。通过学习这些数据中的模式，模型能够生成全新的合成视频片段。然而，Runway 拒绝透露其训练数据的具体来源，部分原因是保护商业竞争优势，同时也因为训练数据的细节通常涉及潜在的知识产权诉讼敏感问题。

一个典型的案例是，Runway 目前正面临由艺术家群体提起的诉讼。该诉讼控告 Runway 及其他几家生成式 AI 公司在未经授权的情况下，使用了受版权保护的艺术作品来训练其 AI 模型。对此，Runway 表示其行为受到“合理使用”（Fair Use）原则的保护，应不承担法律责任。目前该案件的最终结果尚不明朗。

这场法律纠纷对 Runway 来说风险极高。据《The Information》报道，Runway 正在进行新一轮融资，此次融资可能使其公司估值达到 40 亿美元（注：现汇率约合 290.44 亿元人民币）。随着其视频生成模型 API（应用程序编程接口）等新产品的发布，Runway 期望在今年实现 3 亿美元的年化收入目标。

无论这场官司的结果如何，以 Gen-4 为代表的生成式 AI 视频工具正对现有的电影和电视行业构成颠覆性的挑战。根据由代表好莱坞动画师和漫画家的动画协会（Animation Guild）在 2024 年委托进行的研究表明，已有 75% 的采用 AI 技术的电影制作公司在引入该技术后出现了裁员、合并岗位或直接撤销职位的情况。研究同时预测，到 2026 年，生成式 AI 将冲击超过 10 万个美国娱乐行业的就业岗位。