通用型世界模型

Google DeepMind團隊正努力打造不同類型的模型，最新就帶來了名為「Genie 3」的世界模型（World Model），用戶只需要輸入簡單的文字提示，便可生成「數分鐘」模擬物理特性、可互動的世界。

Google DeepMind去年12月就首次展示可根據影像建立互動世界的「Genie 2」，但Genie 2 仍有不少限制，如生成的世界只能玩上大約10至20秒，但現時Genie 3在視覺記憶下保持場景約1分鐘，而且還可以720p畫質、24fps更新率呈現。

團隊也提到，Genie 3能夠高度真實地模擬各種自然現象，如水流、光影效果及複雜的環境互動，也可捕捉動物行為與植物複雜的生長模式。同時，Genie 3也支援動畫角色，加強世界建構，並能高保真度地生成遙遠地點和歷史時代的沉浸式體驗。

Google DeepMind認為，模型視為朝向通用人工智能（AGI）邁出的重要步驟，因為它們允許AI代理在無限的模擬環境中進行訓練。

不過，目前Genie 3僅開放予部分創作者與學術界人士使用。

網網