标签:智源
智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等
10 月 29 日消息,北京智源人工智能研究院(BAAI)推出了新的扩散模型架构 OmniGen,这是一种用于统一图像生成的多模态模型。
智源发布原生多模态世界模型 Emu3,宣称实现图像、文本、视频大一统
10 月 21 日消息,智源研究院今日发布原生多模态世界模型 Emu3。该模型只基于下一个 token 预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态...