无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni,支持图像、音频、文本理解
GoodNav 12 月 16 日报道,无问芯穹今天宣布在其开源的端侧解决方案中推出全新的全模态理解小模型 Megrez-3B-Omni,以及其纯语言模型版本 Megrez-3B-Instruct。
官方指出,Megrez-3B-Omni 是一款专为端侧设计的全模态理解模型,能够处理图像、音频和文本三种类型的数据:
-
在图像理解方面,Megrez-3B-Omni 是当前 OpenCompass、MME、MMMU、OCRBench 等多个主流测试集上表现最佳的图像理解模型之一。
以下是相关链接:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...