阿里巴巴通義千問推升級版Qwen3、全系適配蘋果MLX框架 為蘋果中國版AI作準備?

阿里巴巴 (09988) 旗下通義千問推出基於蘋果(美:AAPL)MLX框架深度優化的全部Qwen3系列模型,市場預計為蘋果AI功能作準備。阿里巴巴股價升逾1%,早段高見114.8元。

通義千問正式開源Qwen3全系列32款MLX量化模型。MLX是一個開源的機器學習框架,專為蘋果芯片深度適配。

現在,從Mac Pro、Mac Studio到Mac mini、MacBook,再到iPad,甚至內存更小的設備如iPhone,都能輕鬆部署Qwen3,真正做到全場景覆蓋!不管你是在追求極致效能,還是低功耗部署,Qwen3都能勝任!

今年2月,阿里巴巴主席蔡崇信確認阿里巴巴與蘋果在人工智能(AI)合作,表示蘋果在中國需要一個在地化的合作夥伴,為iPhone用戶服務,又稱蘋果非常「揀擇(selective)」並曾與數家中國公司交談,形容阿里巴巴最終可與蘋果合作是非常榮幸。此前曾有消息蘋果計劃最早在5月將其人工智能Apple Intelligence引入中國,但其後據報中國版AI正面臨白宮審查。

阿里巴巴通義千問發布Qwen3

阿里巴巴 (09988) 通義千問發布新一代通義千問模型Qwen3。公司表示,旗艦模型Qwen3-235B-A22B在程式碼、數學、通用能力等基準測試中,與DeepSeek-R1、o1、o3-mini、Grok-3 和Gemini-2.5-Pro 等頂級模型相比,表現出極具競爭力結果。

此外,小型MoE模型Qwen3-30B-A3B的活化參數數量是QwQ-32B 的10%,表現更勝一籌,甚至像Qwen3-4B 這樣的小模型也能匹敵Qwen2.5-72B-Instruct的效能。

團隊表示開源了兩個MoE模型的權重:Qwen3-235B-A22B,一個擁有2350 多億總參數和220 多億激活參數的大模型,以及Qwen3-30B-A3B,一個擁有約300 億總參數和30 億激活參數的小型MoE 模型。此外,六個Dense 模型也已開源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,均在Apache 2.0 許可下開源。

Qwen3模式支持兩種思考模式。

思考模式:在這種模式下,模型會逐步推理,經過深思熟慮後給出最終答案。這種方法非常適合需要深入思考的複雜問題。

非思考模式:在此模式中,模型提供快速、近乎即時的反應,適用於那些對速度要求高於深度的簡單問題。