Loading...

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni,支持图像、音频、文本理解

GoodNav 12 月 16 日报道,无问芯穹今天宣布在其开源的端侧解决方案中推出全新的全模态理解小模型 Megrez-3B-Omni,以及其纯语言模型版本 Megrez-3B-Instruct。

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni,支持图像、音频、文本理解

官方指出,Megrez-3B-Omni 是一款专为端侧设计的全模态理解模型,能够处理图像、音频和文本三种类型的数据:

  • 图像理解方面,Megrez-3B-Omni 是当前 OpenCompass、MME、MMMU、OCRBench 等多个主流测试集上表现最佳的图像理解模型之一。

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni,支持图像、音频、文本理解

以下是相关链接:

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...