谷歌发布 Gemini 2.5 Flash AI 模型:专为省钱高效而生
GoodNav 4 月 10 日报道,谷歌今天发布了名为 Gemini 2.5 Flash 的新 AI 模型,该模型注重高效能,展现出强大的性能。
据悉,Gemini 2.5 Flash 将在谷歌的 AI 开发平台 Vertex AI 上线。谷歌公司指出,该模型具备“动态且可控”的计算能力,开发者可以根据查询请求的复杂程度灵活调整处理时间。谷歌在一篇博客中提到:“你可以根据具体需求调整速度、准确性和成本之间的平衡。这种灵活性对优化 Flash 在大批量和成本敏感型应用中的性能至关重要。”
目前,旗舰 AI 模型的成本正在不断增加,而像 Gemini 2.5 Flash 这样的低成本且性能优异(尽管在准确性上可能略有不足)的模型,为用户提供了更具吸引力的替代选择。
Gemini 2.5 Flash 是一种“推理”模型,类似于 OpenAI 的 o3-mini 和 DeepSeek 的 R1,意味着它在回答问题时需要花费更多时间进行事实核查。
谷歌指出,Gemini 2.5 Flash 非常适合于“高容量”和“实时”的应用场景,如客户服务和文档分析。谷歌在博客中提到:“这款工作型模型特别针对低延迟和降低成本进行了优化,理想用于响应式虚拟助手和实时内容总结工具,在大规模应用中,效率至关重要。”
然而,谷歌尚未发布 Gemini 2.5 Flash 的安全或技术报告,这让人们难以清晰了解该模型在哪些方面表现优异,哪些方面需要改进。此前,谷歌表示对于被认为是“实验性”的模型,不会发布相关报告。
此外,谷歌在本周三宣布,计划从第三季度开始将 Gemini 模型(如 2.5 Flash)引入本地环境。谷歌的 Gemini 模型将在谷歌分布式云(GDC)上提供,这是谷歌为数据治理要求严格的客户推出的一种本地解决方案。谷歌表示,公司正在与英伟达合作,将 Gemini 模型引入符合 GDC 标准的英伟达 Blackwell 系统,客户可以通过谷歌或其首选渠道购买这些系统。