Google公布一系列AI新進展 Gemini 2.5 Flash及Pro模型獲升級

Google及Alphabet行政總裁Sundar Pichai在會上提到,世界正比以往轉變得快,人類正以前所未有的速度採用AI,「Gemini應用程式的月活躍用戶已激增至4億,AI Overviews功能也已觸及逾15億名用戶,可見AI已經深入人類的生活。」他也強調,這些進展意味著我們正處於AI平台轉變的新階段,過去數十年的研究正逐步變成全球個人、企業和社區的現實情景。他亦提到,Google將會繼續將尖端研究轉化為現實,打造更加智能、自主且個人化的AI。

Pichai提到,自上屆I/O大會以來,已經宣布了10多個基礎模型、多項研究突破,並發布了超過20個主要的AI產品和功能。但該企並未會因此而停下,在今年的I/O大會上,亦帶來多項新功能,其中最受外界關注的,相信是其Gemini 2.5系列的升級版模型。

Google在會上表示,其中Gemini 2.5 Pro在學術基準測試中表現出色,目前在WebDev Arena編碼排行榜也處於領先狀態,Elo分數達到1420。Google強調,Gemin 2.5 Pro模型在文字和影片的理解邏輯性能中,都得到改善,在用於構建AI學習系統的五項學習科學原則中,它在每一項上均超越了頂尖模型。

添增強推理模式 回應前考慮多種假設

同時,Google也正測試在Gemin 2.5 Pro模型加入名為「Deep Think」的增強推理模式,透過採用新的研究技術,使模型在回應前能考慮多種假設,在複雜數學和編碼任務上表現出色。Google DeepMind技術總監Koray Kavukcuoglu指出,2.5 Pro Deep Think在美國數學奧林匹克(USAMO)中取得優異成績,「這是目前最具挑戰性的數學基準之一」。它還在測試多模態推理的MMMU上獲得84.0%的分數。

至於專為速度和低成本而設的Gemini 2.5 Flash,幾乎在每個方面都有所提升,例如推理、多模態、程式碼和Long-context等關鍵基準測試中表現更好,同時效率更高,經過該企評估,預料使用字詞(Token)可減少20-30%。

升級版2.5 Flash現已在Google AI Studio中供開發者預覽、在Vertex AI中供企業使用,並在Gemini應用程式中對所有人開放。