OpenAI用GPT-5.2穩住了戰局？奧爾特曼：預計1月取

schedule 2025/12/12 13:52:02

OpenAI於當地時間週四宣佈推出其迄今爲止最先進的AI模型GPT-5.2。同日，該公司首席執行官山姆·奧爾特曼（Sam Altman）對媒體表示，預計將在1月結束此前在內部發布的“紅色代碼”預警。

OpenAI表示，最新的GPT-5.2模型在生成電子表格、製作演示文稿、圖像感知、代碼編寫以及長上下文理解等方面均優於此前版本。GPT-5.2已於週四起在OpenAI的ChatGPT聊天機器人及其應用程序接口（API）中上線。

此次發佈距離OpenAI推出GPT-5.1模型僅過去數週。競爭對手Anthropic和谷歌也在上月發佈了新模型，促使OpenAI宣佈進入“紅色代碼”狀態，集中力量改進ChatGPT，並暫緩其他項目。

這是一場高風險競爭的一部分。隨著消費者和企業日益將AI融入日常生活和工作流程，科技巨頭正競相打造使用最廣泛的模型。OpenAI寄望於其GPT系列模型來定義未來，同時也希望藉此支撐公司5000億美元的估值以及超過1.4萬億美元的計劃支出。

OpenAI應用業務首席執行官菲吉·西莫（Fidji Simo）在週四的媒體簡報會上表示：

“我們宣佈進入紅色代碼，是真正向公司釋放一個信號——要在某一個領域集中調配資源，這也是明確優先級、同時對其他事項進行降級的一種方式。我會說，確實有更多資源被投入到ChatGPT整體上，這有助於此次模型的發佈，但這並不是它恰好在本週推出的直接原因。”

奧爾特曼週四在接受CNBC採訪時則表示，谷歌發佈Gemini 3模型對公司各項指標的影響低於其最初擔憂。他預計OpenAI將在1月結束紅色代碼狀態。

“我認爲，當競爭威脅出現時，你就應該集中精力應對，並迅速解決。”奧爾特曼說。

OpenAI表示，GPT-5.2將提供Instant、Thinking和Pro三個版本。其中，Instant在寫作和信息檢索方面速度更快；Thinking更適合代碼編寫和規劃等結構化工作；Pro則面向複雜問題，提供最準確的答案。

該公司稱，GPT-5.2在多項行業基準測試中位居前列，包括用於評估代理式編程能力的SWE-Bench Pro，以及研究生水平科學推理測試GPQA Diamond。在OpenAI今年早些時候發佈的評估體系GDPval中，GPT-5.2在70.9%的明確任務上擊敗或追平了行業頂尖專業人士。

西莫表示：“這項工作已經推進了非常非常多個月。儘管我們爲能夠保持較快的模型發佈節奏感到自豪，但這次具體的整合早已籌劃了一段時間。”

Anthropic的最新模型Opus 4.5在SWE-Bench Verified測試中的得分高於GPT-5.2。該測試用於評估AI系統的軟件編程能力。OpenAI向記者表示，與SWE-Bench Pro相比，這一基準在“抗污染性、挑戰性、多樣性以及工業相關性”方面都較弱。

OpenAI成立於10年前，最初是一家研究實驗室，但自2022年推出ChatGPT以來，已成長爲全球增長最快的商業機構之一。目前，每週使用其聊天機器人的用戶已超過8億人。