- 阿里巴巴更新開源視訊生成模型Wan2.2-S2V
- 模型可由圖片與音頻生成數碼人視頻
- 新模型提升視頻創作效率
阿里巴巴 (09988) 周二發布並開源全新的「通義萬相(WanAI)」Wan2.2-S2V模型,號稱僅需一張靜態圖片和一段音頻,即可以生成面部表情自然、口型一致的電影級數碼人視頻。阿里巴巴表示,通義萬相Wan2.2-S2V單次生成的視頻時長可達分鐘級,大幅提升數碼人直播、影視製作、AI教育等行業的視頻創作效率。
阿里巴巴表示,Wan2.2-S2V是語音驅動生視頻 (Speech-to-Video)模型,創作者可透過語音音頻驅動生動的動畫形態,並支持多樣化的主體形象,包括卡通、動物以及風格化的形象。
阿里巴巴表示,Wan2.2-S2V可靈活支持 480P 與 720P 的解像度輸出,確保生成 的高質畫面符合多樣化的專業與創意標準,既適用於社交媒體內容,也適合專業展示。
另一項重要突破在於模型創新的幀處理技術,可將任意長度的歷史幀壓縮為單一且緊湊的隱層 特徵 ,大幅降低計算消耗,並成功實現長視頻的穩定生成,從而解決長時段動畫內容製作中 的關鍵挑戰。
阿里巴巴股價曾逆市升逾2% 可靈受威脅、快手跌4%
阿里巴巴將於周五公布業績。
阿里巴巴周三股價一度逆市上揚2.5%,見124.3元,惟午後隨大市走弱,並一度轉跌。
至於因應視頻模型「可靈AI(KlingAI)」商業化進程而獲看好的快手 (01024) 午後跌幅擴大至3.6%,暫報76.25元。