是否使用DeepSeek?蘋果CEO庫克:感覺很好

中國發展高層論壇在京舉行,據內媒報道,蘋果CEO庫克(Tim Cook)被問及是否有使用過DeepSeek時,他回答當然,並形容感覺很好(That’s great)。

論壇主要中方代表包括商務部部長王文濤 、人民銀行行長潘功勝、國家金融監督管理總局局長李雲澤、聯想集團(00992)董事長兼首席執行官楊元慶、小鵬汽車(09868)董事長、首席執行官何小鵬、新希望集團董事長劉永好、宇樹科技創始人兼首席執行官王興興、香港交易所主席唐家成等。

據年會主要外方代表名單,西門子股份公司董事會主席、總裁、首席執行官博樂仁(Roland Busch)、蘋果公司首席執行官蒂姆·庫克(Tim Cook)、三星電子會長李在鎔(Jay Y. Lee)、寶馬集團董事長齊普策(Oliver Zipse)、梅賽德斯-奔馳集團股份公司董事會主席康林松(Ola Källenius)、高通公司總裁、首席執行官安蒙(Cristiano Amon)等參加。

英偉達GTC發布新AI芯片 個人電腦可裝入DeepSeek模型運行

  • Nvidia 宣布新一代 AI 芯片,Vera Rubin 芯片預計 2026 年交付
  • Blackwell Ultra 芯片今年下半年上市
  • 發布新的個人電腦芯片,令其可以運行大型AI模型,例如Llama 或 DeepSeek

Nvidia(美:NVDA;英偉達)在年度 GTC 會議上發布新芯片,以助建構及部署artificial intelligence(AI)模型,行政總裁黃仁勳表示,Blackwell Ultra芯片系列將於下半年付運,而下一代芯片Vera Rubin將於2026年交付。

由於發布會技術含量高,未有太多訂單消息,英偉達股價挫3.4%,收報115.43美元,成交348.22億美元,為成交最活躍美股。

Feynman芯片將於2028年上市
自AI狂潮以來,英偉達新的芯片架構由兩年一代,加速至每年一代。在Rubin芯片之後的新一代芯片,將以物理學家Richard Feynman命名,延續其以科學家名字命名芯片系列的傳統,Feynman芯片將於2028年上市。

英偉達發布會預計將有 25,000 名與會者和數百家公司討論如何將該公司的硬體用於人工智能,包括 Waymo、微軟和福特,其中通用汽車亦宣布新一代汽車使用英偉達的服務。

AI PC芯片 可以運行大型AI模型
英偉達同時發布新的電腦芯片,包括兩款用於AI PC的DGX Spark及DGX Station,令其可以配置大型AI模型,例如Llama 或 DeepSeek。

同時宣布更新芯片聯網部件,令其可以將數百或數千個 GPU 連接在一起,使它們作為一個整體工作,同時還發布了一款名為 Dynamo 的軟體包,幫助用戶充分利用他們的芯片。

英偉達預期Vera Rubin芯片將於2026年下半年交付,系統有兩個組件,分別為中央處理器(CPU)Vera以及圖像處理器(GPU)Rubin,名字來自天文學家Vera Rubin。Vera是英偉達首款客製化 CPU 設計,基於 Olympus 的核心設計。

英偉達指,以前當需要 CPU 時,英偉達會使用Arm 的現成設計,這些客制化的設計來自高通及蘋果,因為已更度身定制並實現更好的性能。而英偉達使用Vera CPU,比去年Grace Blackwell 芯片快兩倍速度。

Rubin推理管理 50 petaflops 為Blackwell兩倍
與 Vera 搭配使用時,Rubin 可以在進行推理時管理 50 petaflops,是該公司當前 Blackwell 芯片 20 petaflops 的兩倍多。Rubin 還可以支援高達 288 GB 的快速內存,這是 AI 開發人員關注的核心規格之一。

英偉達也對 GPU 進行更改, 英偉達表示,Rubin 其實有兩塊 GPU。目前市場上的 Blackwell GPU 實際上是兩個獨立的芯片組裝在一起,並作為一個芯片運作。從Rubin開始,當兩個或多個芯片組合成一個芯片時,它會稱為各自獨立 GPU。2027 年下半年,英偉達計劃發布一款「Rubin Next」芯片,將四個芯片組合成一個,使 Rubin 的速度提高一倍,並將其稱為四個 GPU。英偉達表示,這款產品將安裝在名為 Vera Rubin NVL144 的機架上。

至於Blackwell Ultra,每秒將可產生更多tokens(代幣),令芯片可產生更多內容。雲端供應商可以使用 Blackwell Ultra去提供進階的AI服務,是2023年推出Hopper的50倍。

四大雲端運算公司買入Blackwell 為Hopper3倍
Blackwell Ultra 將推出與 Arm CPU 配對的版本GB300,以及僅備 GPU 的版本B300,並將推出在單一伺服器中配備八個 GPU的版本以及配備 72 個 Blackwell 芯片的機架版本。

英偉達表示,四大雲端運算公司部署的 Blackwell 芯片數量是 Hopper 芯片的三倍。

國產AI語言大模型DeepSeek於1月發布後,英偉達指,將使用該模型對其幾款新產品進行基準測試。Blackwell Ultra將更適合推理模型。

美商務部據報在政府設備禁用DeepSeek

據路透社報道,美國商務部各部門最近幾周通知工作人員,中國人工智能(AI)模型深度求索(DeepSeek)已被禁止在其政府設備上使用。

根據路透和兩名知情人士看到的消息,一封發給美國商務部各部門員工的群發電郵稱,為了確保商務部信息系統的安全,所有政府提供的設備廣泛禁止訪問DeepSeek。

郵件指,「請勿下載、查看、訪問任何與DeepSeek相關的應用程式、桌面應用程式或網站。」

華府官員及國會議員早已提出,關注DeepSeek威脅數據私隱及敏感的政府資料。

眾議院情報委員會兩名議員上月提出法案,禁止政府設備使用DeepSeek,本月初再去信各州長,提出同樣要求,指美國的數據一旦落入中共手上,將會是一筆巨大資產。

王亞軍:外資才是港股成交增2000億主力 DeepSeek讓長線基金「信仰改變」

  • 港股成交從前兩年平均約1000億元,增至近期接近3000億
  • 高盛ECM主管王亞軍:國際長綫基金參投IPO活動恢復至正常水平
  • 長綫基金回來有三關鍵,包括DeepSeek帶來「投資信仰改變」

高盛亞洲(日本除外)股票資本市場聯席主管王亞軍接受本報訪問時稱,港股日均成交近逼近3000億,較前兩年平均多出近2000億,北水只佔約30%貢獻,外資才是主力,並形容國際長綫資金「真正回來了」。

他解釋,港股通近期日均買入金額從200多億增至800多億,增加約600多億元,其餘增加的量不可能是印鈔機印出來,只可能是國際投資者參與。

高盛:國際長線基金參投IPO已恢復至正常水平
對於部分投行引用數據指國際長倉基金未明顯流入,王亞軍就認為,每家投行的交易生態不同,數據難免有偏見,即使長綫基金交投量肯定不如對冲基金活躍,

(從近期參與的交易)我們真實看到他們回來買東西,而他們對市場股價穩定性和長期發展起了發揮基石作用,但沒有回到牛市是毫無疑問,買入的股票亦是非常有選擇性的、估值很自律

王亞軍指出,近期高盛參與的香港新股發行(IPO)中,國際長綫基金的平均訂單數量逾20個,是過去兩年的4至6倍,基本已恢復至正常水平。他相信,國際長綫基金對中資股低配兩年有多,不會一下子全數歸來,相信近期香港火熱的股票融資活動可延續數季。

去年中國境外股票發行量按年回升1.3倍,當中新股集資額139億美元,香港市場佔約112億美元。王亞軍認為,今年港股新股集資要做到250億美元(約1,950億港元),

我覺得是可以期待的。我們今年特別的忙,我基本都回不了家,天天都在外面做專案。

高盛:DeepSeek「AI創新或許不到1%」 足以令投資者如夢初醒
王亞軍分析長綫基金回流主要有3大關鍵:

首先,去年中央政府表態支持經濟起了築底作用

其次,即使中國經濟風險沒有減少,但中國市場市盈率在刺激政策前僅為美股、印股一半,隨最新估值回升至12.7倍,仍較標普、MSCI印度指數折讓40%。

第三,DeepSeek帶來「投資信仰」改變。王亞軍稱,回到內地時亦會聽到評論「DeepSeek在AI世界的創新可能連1%也佔不到」,但它足以帶來巨大反差,

大家以前都覺得中國AI沒戲了,沒晶片、沒人員。DeepSeek的出現令投資者如夢初醒,中國仍是具有創新能力。當國際對中國資產信仰改變的時候,就會帶來大量的買賣。

DeepSeek謹慎對待商業化 梁文鋒據報不急於融資

DeepSeek熱度不減,有資本遞出橄欖枝。不過,有消息稱,創始人梁文鋒表示不急於獲得投資,原因是擔心外界干預決策。

梁文峰據傳暫不考慮融資

有消息指,騰訊及阿里巴巴等科技巨頭高層與梁文峰會面,探討合作機會,但梁文峰表明暫不考慮融資,擔心外部投資者會干預公司決策。

此外,據知情人士透露,部分國有銀行已提出向DeepSeek 提供低息貸款。

還有知情人士透露,梁文峰不打算對DeepSeek的核心AI模型收費。

報道稱,自2023年底以來,DeepSeek曾向多間家風投機構自薦,包括部分外資公司,但這些機構因看不見明確的回報路徑而拒絕投資。隨著近期R1模型的崛起,投資者興趣大增,但梁文峰基於公司長期戰略考慮後予以拒絕。

目前,DeepSeek面臨的最大挑戰是如何應對激增的用戶流量。由於大量用戶湧入,服務頻繁崩潰,使用者每日可與聊天機器人的互動次數受限。為緩解伺服器壓力,DeepSeek甚至為凌晨使用服務的付費用戶提供大幅折扣。有業界人士認為,鑒於當前困境,公司應考慮接受外部投資。

DeepSeek理論日賺47.6萬美元 為何實際上未做到預期?

深度求索DeepSeek近日宣布,其線上服務「成本利潤率」(Cost Profit Margin)高達 545%,向外界暗示其未來潛在利潤率水平,不過外界或有一個疑問,為何DeepSeek現時實際收入仍低於理論水平?

首先成本利潤率高達545%在於DeepSeek模型的稀疏優化能力及硬件利用率極高。

DeepSeek推理成本壓縮到極致
稀疏優化能力簡單來說,就是通過減少實際參與計算的激活節點,避免全參數計算,但同時保持推理水平,配合「計算-通信重疊」、「動態負載均衡」等技術,將單位 token 的推理成本壓縮到極致。

其次是硬件利用率極高,白天高峰期段使用全部節點(即H800 GPU資源)全用於推理,夜間低負載時,會釋放GPU資源用於訓練研究,避免閒置成本。

高峰時期佔用278個節點

DeepSeek表示,V3與R1推理服務合併計算,高峰時佔用節點達278,平均佔用226.75個節點,每個節點相當於8塊H800 GPU。假設一塊H800 GPU 的租賃成本為每小時2美元,則每天的總成本為87,072 美元。

DeepSeek又統計,V3及R1在24小時內總輸入及總輸出的Token為6080億及1680億個, 如果所有Toekn都按照 DeepSeek-R1 的定價計費,則每日總收入將達到 562,027 美元,成本利潤率為545%。

DeepSeek-R1收費:0.14 美元/每100萬輸入Token(快取命中)、0.55 美元/每100萬輸入Token(快取未命中)、2.19 美元/每100萬輸出Token。

3原因令實際收入不及理論

然而,實際收入存在落差的原因包括DeepSeek-V3 的定價明顯低於 R1。

其次是DeepSeek為擴大用戶覆蓋,換取用戶黏性、市場份額,網頁和APP服務免費,變相無法變現部分Token 流量。

第三是非高峰時段,DeepSeek將自動採用夜間折扣,令收費再打折扣。

而且DeepSeek 的成本利潤率「Cost Profit Margin」概念與毛利率相似,將收入減去營收成本,然而,AI 公司的研發開支、模型訓練成本、人力成本、資本開支巨大,故DeepSeek 成本利潤率雖然優秀,但相信與實際列帳利潤水平仍有差距。

百度搜索接入DeepSeek、文心大模型深度搜索功能

百度 (09888) 宣布,旗下「百度搜索」和文心智能體平台,將全面接入DeepSeek 和自家文心大模型最新的深度搜索功能,搜尋用戶可免費使用相關功能,而文心智能體平台的開發者可以調用DeepSeek模型創建並調優智能體。

百度指,文心大模型深度搜索功能2月13日上線,可為用戶提供專家級內容回覆,並處理多場景任務,實現多模態輸入與輸出。

Google人工智能負責人:DeepSeek花費不足600萬美元開發AI的說法「誇大、有些誤導」

  • DeepSeek開發成本低於競爭對手
  • DeepMind質疑DeepSeek成本計算方式
  • DeepSeek可能利用西方模型

DeepSeek出現令市場重新關注中國人工智能的發展,負責訓練Alphabet(美:GOOG)旗下Google人工智能的DeepMind行政總裁Demis Hassabis認為,DeepSeek花費不足600萬美元開發AI系統的說法「誇大了,而且有些誤導人」。

可能只是總成本的冰山一角

DeepSeek聲稱,其聊天機器人和AI模型的開發成本遠低於DeepMind和OpenAI等美國競爭對手,震驚市場。

不過,Hassabis稱,DeepSeek似乎僅公佈了最後一輪的訓練成本,而這是總成本的冰山一角。

沒有看到新的尖端技術

Hassabis也反駁DeepSeek的出現,顛覆AI開發經濟效益的看法,指「我們沒有看到新的尖端技術,DeepSeek並非效率曲線上的一個異類」,並指DeepSeek似乎倚賴一些西方模型作為來源。

DeepSeek稱其以560萬美元的計算成本,使用英偉達(美:NVDA)上一代芯片訓練其AI模型。美國當局已經啟動調查,評估DeepSeek是否通過新加坡採購芯片,藉以規避芯片禁令。

南韓國防部、外交部等部門 封禁DeepSeek

據韓聯社報道,南韓外交、國防和產業部門週三(5日)對DeepSeek採取封禁措施。

據多數政府相關人士消息,國防部、外交部和產業通商資源部自行決定限制通過支援外網連接的電腦登錄DeepSeek。國防部相關人士受訪時表示,各方對DeepSeek存在技術性憂慮,國防部針對用於軍部工作的聯網電腦採取了封禁措施。另一名官員表示,利用支援外網連接的電腦訪問DeepSeek網站時顯示「訪問限制」的提示。

報道稱,隨著DeepSeek過度採集用戶數據的質疑發酵,政府部門採取封禁措施,以消除利用生成式AI工具可能導致敏感資訊外泄的擔憂。上述這些部門處理的資訊中涉及外交安保和經貿通商領域的機密較多,因此採取如上的封禁措施。

智雲健康接入DeepSeek-R1模型提升智雲大腦 股價高開近15%

  • 智雲健康:將DeepSeek-R1模型接入智雲大腦
  • 進一步增強智雲大腦的數據挖掘能力
  • 提升公司醫院SaaS及藥店SaaS的慢病管理效率

智雲健康 (09955) 公布將DeepSeek-R1模型接入其專屬醫療人工智能智雲大腦,進一步增強智雲大腦的數據挖掘能力並提升公司醫院SaaS及藥店SaaS的慢病管理效率。智雲健康昨炒上後今早再高開14.9%,開報1.85元,成交117.4萬元。

智雲健康表示,智雲大腦對DeepSeek-R1模型的接入,結合了先進的數據分析和人工智能技術,通過大數據分析及機器學習算法,為慢病管理提供精準的決策支持。此次接入後,藉助公司超過10億份電子病歷,本公司的ClouD GPT及ClouD DTx模型將實現醫療知識圖譜和臨床決策支持系統的功能升級,以優化用戶體驗並提高診斷效率。