- 英偉達推出新 AI 芯片 Rubin CPX
- Rubin CPX 處理超長上下文推理任務
- 新芯片效能提升,注意力加速三倍
英偉達(美:NVDA)在美國時間周二(9日)宣布,明年年底推出新的人工智能芯片「Rubin CPX」,針對處理超長上下文推理任務而設計,適合於影片製作、軟件製作等複雜應用。「Rubin CPX」芯片將基於英偉達的下一代Rubin架構,Rubin架構是其目前最新「Blackwell」技術的繼承者。
英偉達表示,人工智能模型處理1小時的影片內容可能需要多達100萬個詞元(token),這對傳統GPU(圖形處理器)來說是一項挑戰。詞元指的是人工智能模型處理的資料單位。
為了解決這個問題,英偉達將把冗長的處理流程中的各個步驟,例如視訊解碼、編碼和推理(即人工智能模型產生輸出的過程)整合到其新芯片中。
Rubin CPX技術規格顯著提升
Rubin CPX技術規格有顯著提升,GPU提供30千萬億次浮點(petaflops)運算能力(NVFP4 精度),配備128GB GDDR7記憶體,並內建視訊編解碼硬件。相較於英偉達目前主流的GB300 NVL72系統,新平台的注意力加速效能提升3倍。完整的Vera Rubin NVL144 CPX平台在單一機架中整合144個Rubin CPX GPU、144個Rubin GPU和36個Vera CPU,提供8 Exaflops AI效能,較GB300 NVL72系統高出7.5倍。
英偉達行政總裁黃仁勳表示,Rubin CPX是首款專為百萬級詞元處理設計的CUDA GPU,「正如RTX革新了圖形與物理AI,Rubin CPX是專為大規模上下文AI打造的CUDA GPU,能支持模型同時推理數百萬個知識詞元」。