由馬斯克(Elon Musk)創立的人工智能初創公司OpenAI,在9月開放文字轉圖像模型DALL-E,只需輸入文字就會製作相應的圖像。OpenAI日前再發布3D AI模型工具Point-E,只需輸入描述文字,就能在一至兩分鐘內製作相應的3D圖像,速度較市面同類工具快百倍。
用於電影CGI效果、建設元宇宙
3D建模用常於各種行業和應用程式,包括電影的CGI效果、電視遊戲、VR/AR、NASA的月球坑測繪任務、Google的遺跡保護項目,以及Meta的元宇宙等,都取決於3D建模能力。然而,創建逼真的3D圖像始然是一個耗費資源和時間的過程。
市面上的3D建模工具,如Google的DreamFusion系統,通常需要使用多個GPU及數小時來製作圖像,但OpenAI表示,Point-E則只需要使用一個GPU,而且製圖時間僅一至兩分鐘。
OpenAI解釋Point-E的運作原理,是根據輸入的文字描述,生成一個合成視圖3D渲染,然後通過一系列擴散模型運行生成的圖像,來創建初始3D、RGB圖像的1,024點雲(Point Cloud)模型,然後是更精細的4,096點雲模型。