騰訊再下一城 「混元視覺理解模型」盲測拿下世界第三

騰訊 (00700) AI模型再下一城,混元視覺理解模型Hunyuan-Vision-1.5-Thinking於周二凌晨發布後,再在權威的LMArena.ai盲測平台,在用家的投票中,獲得全球第三、中國第一的排名。

Lmarena於社交平台指,「在評估具有視覺功能的人工智慧模型時,與文本相比,增加了新的複雜性。為了良好的表現,模型必須從圖像中提取資訊,理解這些資訊,並將視覺資訊與文本結合,應用於多種用例,例如:圖表解釋、文檔解析、根據視覺內容建議標題和文案,以及解決幾何問題的能力等等。」

騰訊的「混元圖像3.0」日前亦在盲測平台拿下排名第一,打贏Google(美:GOOG)的gemini-2.5-flash-image-preview (nano-banana)。

騰訊於微信公眾號指,Hunyuan-Vision-1.5-Thinking具備領先的多語言多模態理解和推理能力,能夠通過多輪的反思,更加深入地理解「看」到的內容,完成相應的指令任務。同時,模型在更高級的任務如視覺推理和3D空間理解,也有比較好的表現。

例如用於上傳圖片,問圖中是什麼花,模型便會識別圖片中的物體。騰訊指,模型會深度思考,通過多輪思考和推理來拆分問題,一步步接近正確答案。