OpenAI 推出GPT 4.5、Plus用戶下周可用 Meta擬推AI App、Sam Altman 回敬:我們會做社交App

  • OpenAI推出GPT-4.5預覽版
  • GPT-4.5幻覺率降低,ChatGPT Pro、Plus用戶可先行使用
  • Meta將推出獨立AI應用程式,與ChatGPT競爭

ChatGPT開發商OpenAI周四推「GPT-4.5的研究預覽版」,OpenAI形容,這是其迄今最大、知識最豐富的模型,現已開放予每月訂閱費用200美元的「ChatGPT Pro」用戶,下周再向交月費20美元的「ChatGPT Plus」訂閱用戶開放。 OpenAI行政總裁Sam Altman表示,屆時公司將增加數萬塊GPU,提供算力支撐。

Altman稱,GPT 4.5是第一個讓他感覺像是在和一個有思想的人交談的模型,「我曾經多次坐在椅子上,驚訝地發現人工智能確實能給出很好的建議」。

他續指,壞消息是「這是巨大而昂貴的模型」,需要分批向用戶推出。

另外,社交平台Facebook母企Meta據報計劃今年第二季發布獨立的Meta AI應用程式,並目標與ChatGPT競爭。外電引述消息指,Meta 還計劃測試 Meta AI 的付費訂閱服務,效仿ChatGPT向付費用戶提供更強大版本AI的做法。

Altman在社交平台轉載有關報道時稱,將會推出社交App回敬,並言:

哈哈,如果Facebook試圖攻擊我們,而我們只是反擊,事情會很有趣

GPT4.5能減少幻覺率 惟部分AI測試中未及推理模型DeepSeek、Claude
在主要檢視 AI 在處理簡單、事實性問題準確度的SimpleQA測試﹐GPT4.5在準確度和處理幻覺的評分中,GPT-4.5的表現更勝自家GPT-4o和推理模型o1、o3-mini。GPT 4.5的幻覺率(生成不準確資訊的機率)為37%,較GPT-4o的接近60%改善。

不過,在部分AI基準測試中,例如編程能力SWE-Bench Verified基準測試,GPT-4.5與GPT-4o和o3-mini表現相當,但遜色於OpenAI的deep research和Anthropic的Claude 3.7 Sonnet。在SWE-Lancer程式測試(衡量AI產生完整軟件功能的能力)上,GPT-4.5超過了GPT-4o和o3-mini,但仍不及deep research。