Google在9月推出圖像生成與編輯工具Nano Banana,當時成功帶動了Google Gemini的用戶數量,吸納至少千萬名全新Gemini用戶。所以Google固然不會停步,最新就推出「Nano Banana Pro」,此工具以最新的Gemini 3 Pro 為基礎,大幅提升推理能力,以及對真實世界的理解能力,能夠先「思考」,再將文字轉成圖像。
利用推理能力,Nano Banana Pro可以根據用戶提供的內容、現實世界的資料,生成資訊圖表和圖解。透過簡單指令,例如「製作一張圖表,顯示如何製作茶」,Nano Banana Pro即能製作食譜等圖表。此工具甚至可連結Google的知識庫,快速將天氣、體育賽事等即時資訊轉為圖像摘要。
惟AI的弊病,在於生成圖像時將文字變成「鬼畫符」。Nano Banana Pro 則解決了此問題,能直接呈現正確且清晰的文字,保證圖表準確。此外,Gemini 3 非常擅長理解深度與細微差別,用戶可以在產品打樣或海報中,控制文字的紋理、字體和書寫風格;Gemini的多語言推理能力,也可讓用戶生成多種語言的文字。
加強圖像呈現 保持一致性
除了文字,Nano Banana Pro也加強了圖像呈現。用戶可以使用最14 張參考圖像,同時保持5 個人物的一致性。這意味著用戶可以將草圖轉化為商品視覺圖,大幅降低商業成本,確保品牌形象與氛圍保持一致。
若然希望進一步修正圖片,Nano Banana Pro的新功能也容許用戶直接進行局部編輯。用家可以微調和轉換圖像的任何部分,甚至調整拍攝角度、焦點、色調以及場景光線。另外,用家能夠自訂圖片比例和解析度,兼顧各種場合與用途。
Nano Banana Pro 將在全球Gemini應用程式中陸續推出,用戶只需在選擇 Thinking 模型時使用「生成影像」功能,不過免費版用戶額度有限,用罄即恢復為舊版Nano Banana模型。