谷歌首个通用推理模型登场:揭秘 AI 推理“黑匣子”,登顶 Arena LLM 排行榜
GoodNav 12 月 20 日消息,谷歌 AI Studio 平台于昨日(12 月 19 日)发布了一款实验性质的“Gemini 2.0 Flash Thinking”模型,其重点在于“清晰地展示思考过程”,这是谷歌推出的首个通用推理模型。
该模型不仅具备解答复杂问题的能力,还能模拟人类的逐步推理,清晰展示其“思考”过程,此项创新功能有望在 AI 领域带来变革,并与 OpenAI 的 o1 推理模型形成竞争。相关演示如下:
Google DeepMind 的首席科学家 Jeff Dean 演示了该模型如何通过一系列“思考”步骤来解决物理问题,而 Google 产品负责人 Logan Kilpatrick 展示了模型处理图像和文本信息结合的推理问题的能力。
该模型在 Gemini 2.0 Flash 的速度和性能基础上构建,目前在 Chatbot Arena LLM 排行榜上,Gemini 2.0 Flash Thinking 模型在所有类别中均名列第一,相较于之前的 Gemini-2.0-Flash 模型有了显著提升,尤其是在“硬提示”和“视觉”两个方面,分别提升了 14 分和 16 分。
目前,该模型已在 Google AI Studio 和 Vertex AI 平台上线。谷歌表示,这仅仅是推理旅程的第一步,未来这些推理能力将可能整合进 Gemini 2.0 系列的主要模型中。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...