标签:智源

智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等

10 月 29 日消息,北京智源人工智能研究院(BAAI)推出了新的扩散模型架构 OmniGen,这是一种用于统一图像生成的多模态模型。

智源发布原生多模态世界模型 Emu3,宣称实现图像、文本、视频大一统

10 月 21 日消息,智源研究院今日发布原生多模态世界模型 Emu3。该模型只基于下一个 token 预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态...