谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜

1.3K 0 0

GoodNav 12 月 20 日消息，谷歌 AI Studio 平台于昨日（12 月 19 日）发布了一款实验性质的“Gemini 2.0 Flash Thinking”模型，其重点在于“清晰地展示思考过程”，这是谷歌推出的首个通用推理模型。

该模型不仅具备解答复杂问题的能力，还能模拟人类的逐步推理，清晰展示其“思考”过程，此项创新功能有望在 AI 领域带来变革，并与 OpenAI 的 o1 推理模型形成竞争。相关演示如下：

Google DeepMind 的首席科学家 Jeff Dean 演示了该模型如何通过一系列“思考”步骤来解决物理问题，而 Google 产品负责人 Logan Kilpatrick 展示了模型处理图像和文本信息结合的推理问题的能力。

该模型在 Gemini 2.0 Flash 的速度和性能基础上构建，目前在 Chatbot Arena LLM 排行榜上，Gemini 2.0 Flash Thinking 模型在所有类别中均名列第一，相较于之前的 Gemini-2.0-Flash 模型有了显著提升，尤其是在“硬提示”和“视觉”两个方面，分别提升了 14 分和 16 分。

谷歌首个通用推理模型登场：揭秘 AI 推理“黑匣子”，登顶 Arena LLM 排行榜