阿里巴巴通義千問發布Qwen3

阿里巴巴（09988）通義千問發布新一代通義千問模型Qwen3。公司表示，旗艦模型Qwen3-235B-A22B在程式碼、數學、通用能力等基準測試中，與DeepSeek-R1、o1、o3-mini、Grok-3 和Gemini-2.5-Pro 等頂級模型相比，表現出極具競爭力結果。

此外，小型MoE模型Qwen3-30B-A3B的活化參數數量是QwQ-32B 的10%，表現更勝一籌，甚至像Qwen3-4B 這樣的小模型也能匹敵Qwen2.5-72B-Instruct的效能。

團隊表示開源了兩個MoE模型的權重：Qwen3-235B-A22B，一個擁有2350 多億總參數和220 多億激活參數的大模型，以及Qwen3-30B-A3B，一個擁有約300 億總參數和30 億激活參數的小型MoE 模型。此外，六個Dense 模型也已開源，包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B，均在Apache 2.0 許可下開源。

Qwen3模式支持兩種思考模式。

思考模式：在這種模式下，模型會逐步推理，經過深思熟慮後給出最終答案。這種方法非常適合需要深入思考的複雜問題。

非思考模式：在此模式中，模型提供快速、近乎即時的反應，適用於那些對速度要求高於深度的簡單問題。

S	M	T	W	T	F	S
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30