Google DeepMind推通用型世界模型Genie 3 能生成高度互動虛擬3D環境

Google DeepMind團隊正努力打造不同類型的模型,最新就帶來了名為「Genie 3」的世界模型(World Model),用戶只需要輸入簡單的文字提示,便可生成「數分鐘」模擬物理特性、可互動的世界。

Google DeepMind去年12月就首次展示可根據影像建立互動世界的「Genie 2」,但Genie 2 仍有不少限制,如生成的世界只能玩上大約10至20秒,但現時Genie 3在視覺記憶下保持場景約1分鐘,而且還可以720p畫質、24fps更新率呈現。

團隊也提到,Genie 3能夠高度真實地模擬各種自然現象,如水流、光影效果及複雜的環境互動,也可捕捉動物行為與植物複雜的生長模式。同時,Genie 3也支援動畫角色,加強世界建構,並能高保真度地生成遙遠地點和歷史時代的沉浸式體驗。

Google DeepMind認為,模型視為朝向通用人工智能(AGI)邁出的重要步驟,因為它們允許AI代理在無限的模擬環境中進行訓練。

不過,目前Genie 3僅開放予部分創作者與學術界人士使用。