谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用:腰斩击穿价 0.15 美元买百万 tokens 输出
GoodNav 10 月 5 日报道,科技媒体 NeoWin 于昨日(10 月 4 日)发布一篇博文,指出谷歌公司准备推出 Gemini 1.5 Flash 8B 模型用于商业用途,这将成为谷歌公司最经济实惠的 AI 模型。
早在今年 8 月,曾有报道提到谷歌发布了 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的较小版本,具有 80 亿个参数,专为多模态任务设计,包括大容量任务和长文本摘要。
与原版 Gemini 1.5 Flash 相比,Gemini 1.5 Flash 8B 的延迟更低,特别适合用于聊天、转录和长文本翻译等任务。
Gemini 1.5 Flash 8B 的另一个亮点在于经济实惠的价格,相关计费计划将于 10 月 14 日星期一生效,具体信息如下:
-
在小于 128K 上下文窗口下,每百万个 tokens 的输入提示费用为 0.0375 美元(当前约合 0.26 元人民币)
-
在小于 128K 上下文窗口下,每百万个 tokens 的输出提示费用为 0.15 美元(当前约合 1.1 元人民币)
-
在小于 128K 上下文窗口下,每百万个 tokens 的缓存提示费用为 0.01 美元(当前约合 0.071 元人民币)
相较之下,Gemini 1.5 Flash 模型的每百万输出 tokens 成本为 0.3 美元,该价格自 2024 年 8 月 12 日起实施,因此新版 Gemini 1.5 Flash 8B 的价格相比原版直接缩减了一半。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...