內地人工智能初創DeepSeek無預告下,3月24日(周一)晚上在Hugging Face上傳最新版本模型「DeepSeek V3-0324」,並保持開源和免費風格。綜合DeepSeek介紹、內地傳媒和海外用戶分析,DeepSeek V3並非推理模型,但採用具有6710億參數的專家混合模型(MoE),激活參數370億,並且主要集中在編程能力提升。
根據開源評測平台kcores-llm-arena 最新測試數據,DeepSeek V3-0324的程式碼能力達到328.3分,更勝DeepSeek-R1、OpenAI-o1、普通版Claude 3.7 Sonnet,但未及接近Claude 3.7 Sonnet思維鏈版本的334.8分。
相對於Anthropic的Claude和OpenAI的付費服務,DeepSeek繼續以免費模式開放。
DeepSeek今年1月成為蘋果美國應用商店最受歡迎的免費應用,其較低開發成本的AI模型R1被認為能力可與OpenAI的最強模型媲美,引發市場重新審視巨資建設算力的必要性,令多家美國AI基建產業鏈公司股價受壓。