智能手機、電腦已成為很多人不離身的必須品,最怕遇到的是手機或電腦過熱,但在使用率日高、功能愈來愈多、AI應用需求增的情況下,對芯片的要求愈來愈高,相關的冷卻技術卻追不上預期。
隨著新一代 AI 芯片效能的提升,它們產生的熱量也隨之增加。微軟雲端營運與創新高級技術專案經理 Sashi Majety 表示,若仍依賴傳統的冷卻板技術,最快5年後就會陷入困境。
新型冷卻系統 散熱效果高3倍
Microsoft (微軟)為解決以上挑戰,成功測試了一種新型冷卻系統,其散熱效果比目前常用的冷卻技術冷板 (Cold Plates)高出3倍。更宣布,已成功開發出芯片內微流體(Microfluidics)冷卻系統,可有效冷卻運行模擬 Teams 會議核心服務的伺服器。
該系統採用微流體技術,將液體冷卻劑直接導入熱量的來源的矽片的內部。方法是在矽片背面直接蝕刻出微小的通道,並形成凹槽,使冷卻液能夠直接流到芯片上,令散熱更有效。該團隊還利用 AI 識別芯片上獨特的熱訊號,以能更精確地引導冷卻劑。
應用成果及可靠性 仍需測試
參與項目的研究人員表示,微流體技術可以提高下一代 AI 芯片的效率並提升其永續性。目前,大多數據中心使用的 GPU 都採用冷板技術進行散熱,冷板與熱源之間有多層隔離,限制了散熱量。隨著新一代 AI 芯片效能的提升,它們產生的熱量也隨之增加。Microsoft雲端營運與創新高級技術專案經理 Sashi Majety 表示,若仍依賴傳統的冷卻板技術,最快5年後就會陷入困境。
新型冷卻系統出現後,估計能提高電源使用效率及並降低營運成本,仍需測試其可靠性。雖然微流體技術的散熱性能最高可達冷板的3倍,具體取決於工作負載和配置。微流體技術也將 GPU 內部矽片的最大溫升降低了 65%,但這會因不同類型的芯片而有所差異。
利用AI模擬葉脈 設計微通道
事實上,微流體技術並非新鮮事,但如何實踐一直業界面對的挑戰。Microsoft雲端營運與創新系統技術總監 Husam Alissa 表示
在開發微流體技術時,需要了解矽片、冷卻液、伺服器和數據中心之間的系統相互作用。
當中,單是設計出合適的凹槽已很困難,微通道的尺寸與人的頭髮絲相若,當中不容有任何錯誤。Microsoft與瑞士新創公司 Corintis 合作,利用AI優化仿生設計(Bio-inspired Design )去冷卻芯片上的熱點,這種仿生設計類似樹葉或蝴蝶翅膀的葉脈,證實比傳統由上而下的冷卻熱點方法有效。
而微流體技術需要的不僅是創新的通道設計。它本身也是一項複雜的工程。需要確保通道足夠深,以便有足夠的冷卻液流動但不堵塞,同時又不能太深以至於削弱矽材料,增加其破裂的風險。僅在過去1年,該團隊就進行了4次設計迭代。微流體技術還需要為芯片設計防漏封裝,找到最佳冷卻劑配方,測試不同的蝕刻方法,並開發將蝕刻技術添加到芯片製造的流程中。
以上突破只是Microsoft投資和創新基礎設施以滿足 AI 服務和功能需求的例子之一。該公司計劃在本季投入超過 300 億美元的資本支出,支持包括開發自主研發的 Cobalt 和 Maia 芯片系列。