Loading...

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni，支持图像、音频、文本理解

AI前沿资讯4个月前发布 GOODNAV.NET

875 0 0

GoodNav 12 月 16 日报道，无问芯穹今天宣布在其开源的端侧解决方案中推出全新的全模态理解小模型 Megrez-3B-Omni，以及其纯语言模型版本 Megrez-3B-Instruct。

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni，支持图像、音频、文本理解

官方指出，Megrez-3B-Omni 是一款专为端侧设计的全模态理解模型，能够处理图像、音频和文本三种类型的数据：

在图像理解方面，Megrez-3B-Omni 是当前 OpenCompass、MME、MMMU、OCRBench 等多个主流测试集上表现最佳的图像理解模型之一。

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni，支持图像、音频、文本理解

以下是相关链接：

Github：https://github.com/infinigence/Infini-Megrez
HuggingFace：https://huggingface.co/Infinigence/Megrez-3B-Omni
Infini-AI 异构云：https://cloud.infini-ai.com/genstudio/model/mo-c73owqiotql7lozr
Modelers：https://modelers.cn/models/INFINIGENCE-AI/Megrez-3B-Omni
ModelScope：https://www.modelscope.cn/models/InfiniAI/Megrez-3B-Omni

# AI前沿资讯 # 开源 # 无问芯穹

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

微软推出 Magentic-One：多 AI 智能体协同完成复杂任务

GoodNav.net

1.3K

腾讯混元开源 Hunyuan3D-1.0：首个同时支持文生和图生的 3D 开源大模型

GoodNav.net

1.4K

提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

GoodNav.net

1.4K

「世界开源新王」Reflection 70B 跌落神坛？重测跑分暴跌实锤造假

GoodNav.net

1.4K

摩尔线程开源 OpenCV-MUSA：支持绝大部分 cv::cuda 命名空间下数据结构及 API

GoodNav.net

1.4K

研究人员绕过 GPT-4o 模型安全护栏，利用“十六进制字符串”成功令其编写漏洞攻击程序

GoodNav.net

1.3K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2024 goodnav.net All Rights Reserved