Voyage-3 系列嵌入式 AI 模型登场:1/2.2 成本、1/3 嵌入维度下性能超 OpenAI v3 Large 模型 7.55%
GoodNav 9 月 28 日报道,科技媒体 MarkTechPost 于昨日(9 月 27 日)发布了一篇博文,提到 Voyage AI 公司推出了两个新的嵌入式(Embedding)模型:Voyage-3 和 Voyage-3-Lite。
这两个模型在技术、法律、金融、多语言应用和长文本理解等领域展现出超越同类模型的优势,能够在保持较小模型规模和较低资源消耗的情况下,为开发者提供更高效且易于集成的解决方案。
根据 Voyage AI 官方数据,Voyage-3 在技术文档、代码、法律、金融、网页内容、多语言数据集、长文档和对话数据等方面,以 1/2.2 的更低成本和 1/3 的更小嵌入维度,显著降低了向量数据库(vectorDB)的成本,并且综合跑分超越 OpenAI 的 v3 Large 模型 7.55%。
Voyage-3-Lite 在检索准确性上比 OpenAI 的 v3 Large 模型高出 3.82%,同时成本降低至 1/6,嵌入维度也降至 1/6。
嵌入式 AI 模型
嵌入式模型(Embedding)是一种广泛应用于自然语言处理(NLP)和计算机视觉(CV)等领域的机器学习模型,它能够将高维度的数据转化为低维度的嵌入空间(embedding space),并保留原始数据的特征和语义信息,从而提升模型的效率和准确性。
Voyage-3 在质量上不妥协,提高成本效益
成本效益是新 Voyage-3 系列模型的核心。
Voyage-3 的上下文长度为 32000 个 tokens,是 OpenAI 产品的 4 倍,适合需要高质量检索的企业,且价格合理。
Voyage-3 的成本为每百万个 tokens 0.06 美元,比 Cohere English V3 便宜 1.6 倍,远低于 OpenAI 的 v3 Large 模型。
此外,Voyage-3 较小的嵌入维度(1024 对比 OpenAI 的 3072),因此实现了更低的向量数据库成本,使公司能够有效扩展其应用程序。
Voyage-3-Lite 是该模型的轻量版,经过优化以实现低延迟操作。每百万个标记的费用为 0.02 美元,是 OpenAI 的 v3 Large 模型 1/6.5,并且嵌入维度为 1/6~1/8(512 对比 OpenAI 的 3072)。这使得 Voyage-3-Lite 成为希望以较低成本维持高检索质量的组织的理想选择。
<img title=\"Voyage-3 系列嵌入式 AI 模型登场:1/2.2 成本、1/3 嵌入维度下性能超 OpenAI v3 Large 模型 7.55%\" src=\"https://img.ithome.com/newsuploadfiles/2024