Mistral AI 推出 Mistral OCR API:宣称最快最准光学字符识别,千页 1 美元
GoodNav 3 月 7 日报道,Mistral AI 在当地时间 6 日宣布推出 Mistral OCR API,并声称该 API 是在 OCR 光学字符识别领域表现最佳的解决方案。
Mistral AI 表示该 API 拥有出色的多模态文档处理能力,可以从 PDF、幻灯片、数学表达式、LaTeX 学术文档等复杂文档元素中提取文本信息,结果将以 Markdown 文件格式清晰呈现。
Mistral OCR 模型能够解析、理解和转录数千种脚本、字体和语言。根据 Mistral AI 公开的数据,该模型当前版本在识别方面的表现优于谷歌 Document AI、微软 Azure OCR、OpenAI GPT-4o 等众多竞争产品。
Mistral AI 已将 Mistral OCR 作为其 Le Chat 聊天机器人的默认文档理解模型,该 API 的定价为每千页 1 美元(备注:当前约合 7.2 元人民币),单个节点每分钟可处理 2000 页,这一模型已被应用于历史文化遗产保护等多个场景。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...