OpenAI用GPT-5.2穩住了戰局?奧爾特曼:預計1月取
OpenAI於當地時間週四宣佈推出其迄今爲止最先進的AI模型GPT-5.2。同日,該公司首席執行官山姆·奧爾特曼(Sam Altman)對媒體表示,預計將在1月結束此前在內部發布的“紅色代碼”預警。
OpenAI表示,最新的GPT-5.2模型在生成電子表格、製作演示文稿、圖像感知、代碼編寫以及長上下文理解等方面均優於此前版本。GPT-5.2已於週四起在OpenAI的ChatGPT聊天機器人及其應用程序接口(API)中上線。
此次發佈距離OpenAI推出GPT-5.1模型僅過去數週。競爭對手Anthropic和谷歌也在上月發佈了新模型,促使OpenAI宣佈進入“紅色代碼”狀態,集中力量改進ChatGPT,並暫緩其他項目。
這是一場高風險競爭的一部分。隨著消費者和企業日益將AI融入日常生活和工作流程,科技巨頭正競相打造使用最廣泛的模型。OpenAI寄望於其GPT系列模型來定義未來,同時也希望藉此支撐公司5000億美元的估值以及超過1.4萬億美元的計劃支出。
OpenAI應用業務首席執行官菲吉·西莫(Fidji Simo)在週四的媒體簡報會上表示:
“我們宣佈進入紅色代碼,是真正向公司釋放一個信號——要在某一個領域集中調配資源,這也是明確優先級、同時對其他事項進行降級的一種方式。我會說,確實有更多資源被投入到ChatGPT整體上,這有助於此次模型的發佈,但這並不是它恰好在本週推出的直接原因。”
奧爾特曼週四在接受CNBC採訪時則表示,谷歌發佈Gemini 3模型對公司各項指標的影響低於其最初擔憂。他預計OpenAI將在1月結束紅色代碼狀態。
“我認爲,當競爭威脅出現時,你就應該集中精力應對,並迅速解決。”奧爾特曼說。
OpenAI表示,GPT-5.2將提供Instant、Thinking和Pro三個版本。其中,Instant在寫作和信息檢索方面速度更快;Thinking更適合代碼編寫和規劃等結構化工作;Pro則面向複雜問題,提供最準確的答案。
該公司稱,GPT-5.2在多項行業基準測試中位居前列,包括用於評估代理式編程能力的SWE-Bench Pro,以及研究生水平科學推理測試GPQA Diamond。在OpenAI今年早些時候發佈的評估體系GDPval中,GPT-5.2在70.9%的明確任務上擊敗或追平了行業頂尖專業人士。
西莫表示:“這項工作已經推進了非常非常多個月。儘管我們爲能夠保持較快的模型發佈節奏感到自豪,但這次具體的整合早已籌劃了一段時間。”
Anthropic的最新模型Opus 4.5在SWE-Bench Verified測試中的得分高於GPT-5.2。該測試用於評估AI系統的軟件編程能力。OpenAI向記者表示,與SWE-Bench Pro相比,這一基準在“抗污染性、挑戰性、多樣性以及工業相關性”方面都較弱。
OpenAI成立於10年前,最初是一家研究實驗室,但自2022年推出ChatGPT以來,已成長爲全球增長最快的商業機構之一。目前,每週使用其聊天機器人的用戶已超過8億人。