谷歌发布 Gemini 2.5 Flash AI 模型：专为省钱高效而生

130 0 0

GoodNav 4 月 10 日报道，谷歌今天发布了名为 Gemini 2.5 Flash 的新 AI 模型，该模型注重高效能，展现出强大的性能。

据悉，Gemini 2.5 Flash 将在谷歌的 AI 开发平台 Vertex AI 上线。谷歌公司指出，该模型具备“动态且可控”的计算能力，开发者可以根据查询请求的复杂程度灵活调整处理时间。谷歌在一篇博客中提到：“你可以根据具体需求调整速度、准确性和成本之间的平衡。这种灵活性对优化 Flash 在大批量和成本敏感型应用中的性能至关重要。”

目前，旗舰 AI 模型的成本正在不断增加，而像 Gemini 2.5 Flash 这样的低成本且性能优异（尽管在准确性上可能略有不足）的模型，为用户提供了更具吸引力的替代选择。

Gemini 2.5 Flash 是一种“推理”模型，类似于 OpenAI 的 o3-mini 和 DeepSeek 的 R1，意味着它在回答问题时需要花费更多时间进行事实核查。

谷歌指出，Gemini 2.5 Flash 非常适合于“高容量”和“实时”的应用场景，如客户服务和文档分析。谷歌在博客中提到：“这款工作型模型特别针对低延迟和降低成本进行了优化，理想用于响应式虚拟助手和实时内容总结工具，在大规模应用中，效率至关重要。”

然而，谷歌尚未发布 Gemini 2.5 Flash 的安全或技术报告，这让人们难以清晰了解该模型在哪些方面表现优异，哪些方面需要改进。此前，谷歌表示对于被认为是“实验性”的模型，不会发布相关报告。

此外，谷歌在本周三宣布，计划从第三季度开始将 Gemini 模型（如 2.5 Flash）引入本地环境。谷歌的 Gemini 模型将在谷歌分布式云（GDC）上提供，这是谷歌为数据治理要求严格的客户推出的一种本地解决方案。谷歌表示，公司正在与英伟达合作，将 Gemini 模型引入符合 GDC 标准的英伟达 Blackwell 系统，客户可以通过谷歌或其首选渠道购买这些系统。