英偉達業績超預期 數據中心收入破紀錄 盤後升9%

Nvidia英偉達(美:NVDA)公布去年第四季業績,收入60.51億美元,超預期的60億美元,按年跌21%;Nvidia純利14.14億美元,跌53%;經調整純利21.74億美元,經調整每股盈利0.88美元,超預期的0.81美元,跌33%。毛利率66.1%,跌0.9點。

Nvidia盤後股價升8.7%,報225.5美元。

Nvidia全年業績方面,收入269.74億美元,按年升0.2%;純利43.68億美元,跌55%;經調整純利83.66億美元,經調整每股盈利3.34美元,跌25%。毛利率59.2%,跌7.6點。

Nvidia發布前瞻指引,預期首季收入65億美元,按年跌21.6%,毛利率66.5%,按年跌0.6點。

數據中心方面,Nvidia指,數據中心第四季收入達到破紀錄的36.2億美元,按年升11%;於全個財年收入更達到150.1億美元,升41%。與德銀達成戰略合作伙伴,突破金融服務板塊的AI發展。同時與 Dell 推出第15代 Dell PowerEdge 系統,令企業有效地利用AI實現轉型。在金融服務推出NVIDIA A100 Tensor核心GPU,支援人工智能、資料分析和高效運算。

至於顯示卡遊戲板塊,收入18.3億美元,跌46%。專業視象業務收入2.26億美元,跌65%,汽車及組件業務收入2.94億美元,升135%。

Nvidia Broadcast增Eye Contact功能 讓視線保持直視鏡頭

視像會議和直播的各類應用,成為疫後新常態。芯片商Nvidia旗下的NVIDIA Broadcast應用程式(App),新增「眼神交流(Eye Contact)」人工智能新功能,加強視像會議和直播時,參與者的互動體驗。

在NVIDIA Broadcast App的最新測試版中,Nvidia新增了一個名為「Eye Contact」的功能,可以將視像會議中的說話者,或直播主的眼神,固定在指定的方向。即讓用家的眼神偏移鏡頭的話,該AI功能可以將改變其眼球凝視的方法,令用家的視線彷如直接鏡頭般。

此外,該功能還利用AI功能,保留用家瞳色、眨眼和轉動眼珠等動作。當用家的真實視線移離鏡頭位置太遠時,其「斷開連接功能(even a disconnect feature)」,更可以成為用家真實眼睛和模擬眼睛之間的過渡,讓畫面中的假視線與真視線重合,使整體效果更自然。

然而,正在測試的功能難免未盡完善,Nvidia表示,還有「數以百萬計」的瞳色與環境照明組合向未進行測試。建議並鼓勵用家若在使用中,假視線出現奇怪狀況的話,可以將相關畫面錄像,發送予該企作反饋,以便工程師們研究及改善。

富士康採用Nvidia芯片 開發自動駕駛汽車平台

蘋果(Apple)代工廠富士康所屬的鴻海科技,近年積極為進軍電動車領域鋪路,去年就研發了3款電動車。富士康宣布,將於芯片製造商Nvidia合作,採用Nvidia DRIVE Orin芯片製造車載電腦(Electronic Control Unit, ECU),開發自動駕駛汽車平台。

富士康去年10月曾表示,希望將來能夠與電動車製造商Tesla合作,成為其代工夥伴,因此會加強電動汽車製造以實現業務多樣化。為應對成本上漲及擴大產能,富士康認為是次與Nvidia合作,將有利促進電動車和相關服務推出市場。

Nvidia DRIVE Orin芯片是專門用於車聯網及自動駕駛汽車的運算,Nvidia表示該技術也包括實時處理傳感器信息,將有助富士康克服一些開發上的挑戰,同時亦可滿足市場對自動駕駛和車聯網芯片日益增長的需求。

NVIDIA RTX 50系列Blackwell GPU將帶來NVIDIA歷史上最大的性能飛躍

NVIDIA的RTX 50系列可能會成為該公司第一款採用MCM的主流GPU – 如果最近的報導可信的話。不僅如此Blackwell架構很可能帶來公司歷史上最大的性能飛躍。NVIDIA最近確認Blackwell GPU架構將於2024年發布。

在開始之前,應該指出的是Blackwell架構計劃成為Hopper架構的繼任者,並且交替使用Blackwell和RTX 50的洩漏可能意味著幾件事。Hopper在消費者領域的並行發布 (RTX 40) 的代號為Ada Lovelace,因此Blackwell也有可能獲得其消費類產品。或者Blackwell可能實際上是消費者的代號(儘管不可否認,這種可能性較小)並且數據中心方面的事物將獲得一個新名稱。之前的報導表明Blackwell GPU將採用台積電的3nm製程製造。

謠言來自 RedGamingTech,他們已經收到了一些關於架構的新消息。首先Blackwell將採用全新的SM結構。考慮到底層微架構正在轉向Blackwell的MCM設計——這並不奇怪。此外Blackwell將利用超高速匯流排連接各種SM和小晶片。去噪加速器也將成為光線追踪管道的一部分(現代路徑追踪設置實際上並不追踪整個序列,它們只追踪一部分,而去噪器處理其餘部分),這應該會顯著提高RT性能。

似乎仍然沒有關於規格的消息,儘管消息人士指出正在考慮各種Blackwell GPU,並且很多版本將取決於AMD當前的RDNA3和未來的RDNA4產品的性能。最後RGT給我們留下了以下預告:NVIDIA歷史上最大的性能飛躍。

NVIDIA Hopper在發佈時是世界上最快的4nm GPU,也是世界上第一個配備HBM3的GPU。它的規格甚至比NVIDIA RTX 4090(包含16,384個CUDA)更高,淨總數為18,432個CUDA。Blackwell將對Hopper進行顯著的改進(一如既往)。在先前的洩漏中已經確認了四個NVIDIA Blackwell GPU 。

NVIDIA Blackwell架構以美國統計學家和數學家David Blackwell為基礎,他對博弈論、概率論、訊息論和統計學做出了重大貢獻。他也是第一位入選美國國家科學院的非裔美國人。Blackwell延續了NVIDIA以著名計算機科學家和數學家的名字命名主要架構的趨勢,目前對Blackwell架構知之甚少。我們很可能最終會被導入平行命名法(就像Ada Lovelace之於Hopper),這將完成NVIDIA的第一個MCM雙核。

台積電 3 奈米支援 MCM 技術,NVIDIA Blackwell 架購性能大幅提升

外媒報導,GPU 大廠 NVIDIA 接下來要發表的 Blackwell 架構 RTX50 系列顯卡,傳聞將是首款採用多晶片封裝技術 (MCM) 產品,性能也會大幅進步。不過消息要等到官方 2024 年發表後才能證實。

科技媒體 Wccftech 報導,身為 Hopper 架構後繼者,Blackwell 架構也會有消費等級產品。伺服器市場領域也會推新產品。兩者共通點就是採用台積電 3 奈米製程。

據市場消息,Blackwell 架構 RTX50 系列顯卡將使用串流多處理器模組 (Streaming Multiprocessor,SM) 技術,因 Blackwell 架構正轉向多晶片封裝技術 (MCM),Blackwell 架構下使用高速連線連結小晶片與 SM 模組。將造加速器也會成為光追系統一環,有機會提升執行光追技術 RT 核心的效能。

Blackwell 架構的性能預期,市場人士大多不完全清楚,而是從 AMD RDNA 3 和 RDNA 4 產品性能比較後,大概得出 Blackwell 架構大幅提升的結論。伺服器顯卡方面,NVIDIA Hopper 發表時是世界運算速度最快的 4 奈米製程 GPU,也是世界第一個配備 HBM3 暫存記憶體的 GPU,規格甚至比後來含 16,384 個 CUDA 核心的 RTX 4090 更高,達 18,432 個 CUDA 核心的規格。

先前 NVIDIA 已揭露,Blackwell 架構伺服器產品將有四個 NVIDIA Blackwell 架構 GPU,預期相較 Hopper 架構有大幅性能提升。NVIDIA 的 Blackwell 架構命名是為了紀念美國統計學家和數學家 David Blackwell。他對機率學、概率學、訊息學及統計學等都有重大貢獻,也是第一位入選美國國家科學院的非裔美國人。

美初創推智能農業拖拉機 由NVIDIA AI芯片驅動

農業拖拉機大多採用半自動模式,需要司機駕駛操作,而且是以柴油為燃料。美國初創企業Monarch Tractor推出首款智能農業拖拉機「MK-V」,由NVIDIA AI芯片驅動,透過Nvidia Jetson智能平台運作,無論是否有司機駕駛,都能執行農業任務。

Monarch Tractor行政總裁Praveen Penmetsa表示,MK-V是全電動設計,採用6個Jetson Xavier NX系統模塊,由兩部3D相機和六部標準相機獲取視覺環境,並通過相機鏡頭畫面,就能在農田進行導航和工作。

MK-V每天會收集和分析農作物的數據,可用於實時調整農具、長期產量估計、當前生長階段和其他植物及作物健康指標。Praveen Penmetsa認為,NVIDIA Jetson能使MK-V能夠運行低延遲、實時的AI應用程式,同時節約能源、延長電池壽命、延長運行時間。

NVIDIA獨家絕技輕鬆到手 AMD加速顯示卡大招已成:支援CUDA程式碼遷移

在GPU計算領域,AMD顯示卡不止是面臨硬體性能問題,更重要的一點是NVIDIA的CUDA生態所向披靡,在HPC及AI等領域形成了壟斷,而且只支援NVIDIA自家硬體,不過這個問題也不是沒法解決,A卡照樣能相容CUDA。

前幾天我們報導過國內的摩爾執行緒因為相容CUDA一事引發老外熱議,還有人吐槽成立僅2年的GPU公司都比AMD做得好,這話其實也誇張了點,AMD的顯示卡有自己的生態系統ROCM,而且是開放生態,相容多個計算框架,比如PyTorch、Tensorflow、ONNX-RT、RAJA等。

至於CUDA相容這個問題,AMD也可以解決開發者棘手的程式碼遷移問題,最新的ROOM中支援HIPify工具,可以將基於 CUDA 的檔案 (.cu) 轉換為 HIP 檔案 (.cpp),絕大多數CUDA API都可以一對一轉換為HIP API。

整個轉換大部分都是自動的,不過有部分內容可能需要手動干預,好在不會太繁雜。

AMD還提到了一個最新的例子,TempoQuest (TQI) 開發的AceCAST天氣研究和預報 (WRF) 軟體就從CUDA及OpenACC環境轉向了AMD平台,可以在MI200系列加速卡上使用了。

NVIDIA夥微軟建大型AI超級電腦 將於Azure雲端運行

隨著人工智能(AI)在商業領域廣泛採用,企業對AI的需求也與日俱增。芯片製造商NVIDIA宣布與微軟(Microsoft)合作,建立一個在Azure雲端運行的大型AI超級電腦,處理密集的AI運算工作,滿足更多企業對AI的應用需求。

NVIDIA表示,大型AI超級電腦將採用數以萬計的GPU、NVIDIA的H100及A100芯片。有業內人士表示,每顆A100芯片的價格約1萬(約7.8萬港元)至1.2萬美元(約9.3萬港元),而H100的價格則遠高於此。

採用Quantum-2 InfiniBand 網絡技術

Azure亦是第一個採用NVIDIA Quantum-2 InfiniBand 網絡技術的公共雲,其速度為每秒400 G-bits。NVIDIA指出,這種網絡技術以高速連接伺服器,這對企業AI應用非常重要,因為繁重的AI運算工作需要成千上萬的芯片在數台伺服器上協同工作。

此外,NVIDIA還將與微軟合作開發AI模型,並成為微軟AI雲端電腦的客戶,透過該AI超級電腦開發AI應用,向客戶提供服務。

英偉達第三季收入跌17%勝預期 料轉供予中國新型芯片可彌補當地收入損失

美國芯片巨企英偉達(Nvidia,美:NVDA)第三季營業收入59.3億美元,按年下降17%,符合公司指引59億美元,亦較預期的跌19%為好,不過,經調整每股收益為0.58美元,按年跌50%,遜預期的0.69美元。

英偉達盤後一度抽高近4%,現報161.67美元,升1.6%。

期內,集團遊戲部門銷售額按年下降51%至15.7億美元。Nvidia表示,它向零售商銷售的產品減少了,因為其庫存超過了當前的需求,同時又指,除了中國的新冠病毒「清零政策」外,宏觀經濟狀況正在損害消費者需求。至於數據中心業務,其銷售額為38.3億美元,按年增長31%,增長來自美國雲服務提供商和消費者互聯網公司的銷售。

上季集團毛利率下降11.6個百分點至53.6%,集團歸因於中國對數據中心芯片的需求低迷而計入庫存費用。

展望第四季,英偉達表示,預計第四季度銷售額約為60億美元,低於市場預期的60.9億美元,而毛利率料將恢復至63.2%至66%之間。

另外,就早前美國所下達的芯片禁令,Nvidia表示,在中國被禁止的GPU的銷售額減少將在很大程度上被其替代產品所抵消。英偉達早前提供另一批名為A800的新型先進芯片予中國客戶,以符合美國出口管制要求,並於第三季度投產,是就A100 GPU就未能提供予中國客戶的另一種替代品。

AMD揭秘RX 7000系列顯示卡成本 便宜還能賺錢

NVIDIA新一代旗艦顯示卡RTX 4090用上了台積電5nm製程,效能很強大,但價格亦來到了1599美元。NVIDIA執行長黃仁勳表示,是因晶片代工漲價,其亦沒有辦法。

黃仁勳指出的此點亦為使用先進製程無可避免的難題,且近兩年又恰逢產能吃緊導致大漲價,台積電5nm製程成本不菲。

NVIDIA能靠著產品效能及品牌拉高售價來彌補成本增加的問題,AMD怎麼辦?學NVIDIA那樣大漲價是不可行的。但此次RX 7000系列顯示卡上,AMD可說出乎意料,不僅未漲價,RX 7900 XTX價格(999美元)甚至較RTX 4090、RTX 4080分別便宜了600、200美元。

便宜這麼多還有錢賺,AMD是如何做到的?剛解禁的RDNA 3架構解析中,AMD說明了RX 7000系列顯示卡如何使用Chiplet小晶片設計來解決成本問題。但略顯奇怪的是,AMD說明GPU小晶片成本優勢用的資料卻是Ryzen的PPT內容,或許是CPU、GPU於此方面沒有太大差別,就不重新弄PPT了。

據AMD說法,如果用原生大核心的思路去做7nm製程16核心處理器會很貴,相較2個8核心CCD+12nm IOD核心的成本高出2.1倍之多,差距很大。因為不僅要製造出更大面積的7nm晶片,晶片產量亦會降低,進一步提高成本。

言下之意,用小晶片的思路設計RX 7000系列顯示卡,成本就有優勢多了,此亦為RX 7900 XTX有勇氣便宜那麼多的底氣了。