OpenAI 公布新型 AI 文生图方案“sCM”,号称效率是传统扩散模型 50 倍
GoodNav 10 月 27 日报道,OpenAI 本周推出了一款名为 sCM(连续时间一致性模型)的新型 AI 文生图工具。
与传统的扩散模型相比,sCM 仅需两个步骤便能生成高质量样本,自称能将文生图的效率提高大约 50 倍,并且所生成样本的质量可以与业内领先的扩散模型相媲美,为 AI 文生图开辟了全新路径。
目前,业界普遍采用扩散模型来生成图像和音视频,但传统的扩散模型取样过程往往速度缓慢,通常需要数十到数百个逐步降噪的步骤才能获得高质量样本(例如,使用 SD“炼丹”绘图时,通常要等待很长的降噪时间),这导致了模型效率低下,不适合商业化应用。
虽然已有一些技术试图提升扩散模型的速度,但大多是借助复杂的训练过程来“提纯”模型,或降低输出样本的质量以换取效率。
而 OpenAI 的研究团队则提出了一种名为 sCM 的新文生图方案,这一生成模型方式绕开了传统的扩散模型框架,声称只需两个取样步骤即可生成与扩散模型质量相当的高分辨率样本,极大地缩短了生成时间。
据悉,sCM 的训练方法主要通过预训练扩散模型提炼出来的知识来构建新模型,声称能在缩短取样时间的同时,实现高质量样本的生成。
研究人员使用 ImageNet 512×512 数据集,利用 sCM 方法对模型进行训练,声称能够生成细节丰富且高质量的图像,充分展示其在高分辨率生成方面的潜力。尽管 sCM 的取样步骤仅有两个,但所生成样本的质量依然接近于业内“最佳扩散模型”,声称“差异不到 10%”。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...