谷歌 AI Studio 平臺昨日(12 月 19 日)發(fā)布實驗性的“Gemini 2.0 Flash Thinking”模型,主打“清晰展現(xiàn)思考過程”,是谷歌第一個通用推理模型。
該模型不僅能夠解答復(fù)雜問題,還能模仿人類逐步推理,展現(xiàn)其“思考”步驟,這一創(chuàng)新功能有望革新 AI 領(lǐng)域,和 OpenAI 的 o1 推理模型展開競爭。IT之家附上相關(guān)演示如下:
Google DeepMind 首席科學(xué)家 Jeff Dean 演示了該模型如何通過一系列“思考”步驟解決物理問題;而 Google 產(chǎn)品負(fù)責(zé)人 Logan Kilpatrick 展示了模型如何處理包含圖像和文本信息的推理問題。
該模型基于 Gemini 2.0 Flash 的速度和性能構(gòu)建,在 Chatbot Arena LLM 排行榜上,Gemini 2.0 Flash Thinking 模型在所有類別中均排名第一,較之前的 Gemini-2.0-Flash 模型有顯著提升,尤其在“硬提示”和“視覺”兩項分別提升了 14 分和 16 分。
該模型目前已在 Google AI Studio 和 Vertex AI 平臺上線。谷歌表示,這只是推理之旅的第一步,未來這些推理能力可能會集成到 Gemini 2.0 系列的主要模型中。