Google DeepMind 宣布開發模擬真實世界的 AI 模型

AI 模型近年不斷發展,對於多媒體處理和生成都已經逐漸純熟,不過要處理現實世界的物理變化等細節則尚有改進空間。最近 Google 就宣布開發能夠模擬真實世界的模型,做為 DeepMind 的一部分。

新的開發計畫將由 OpenAI Sora 影片生成工具前共同負責人 Tim Brooks 領導,Brooks 在 X 表示,新團隊將與 Google 現有 Gemini、Veo 和 Genie 等團隊合作,招募文宣說影片與多模態資料 AI 訓練規模化,將是通往通用人工智慧(AGI)的發展方向。新團隊集中開發「即時互動生成」工具,與現有多模態模型 Gemini 等整合,提供更全面的功能。

真實世界模擬應用範圍相當廣泛,從視覺推理、模擬、規劃具身智慧助理 (Embodied Agent),到即時互動娛樂等都會用到。除了 Google 開發中 Genie 模型,其他「世界模型」還有 World Labs、Decart 和 Odyssey 等,可生成互動多媒體內容如遊戲和電影等,以及逼真模擬、訓練機器人等。