ChatGPT三週年:OpenAI還能繼續領跑嗎?
OpenAI於2022年11月30日推出ChatGPT,這一事件被視爲AI軍備競賽的起跑槍,推動了股市上漲,並釋放了成千上萬億美元的投資。而如今,三年過去了,OpenAI能否保持領先地位成爲最大的懸念。
當年,ChatGPT發佈僅五天,就吸引了100萬用戶。三年後,最新版本的ChatGPT具備實時網絡訪問、增強推理能力、編程技能以及圖像和視頻生成能力,已經讓最初的功能顯得相當原始。今年9月,OpenAI推出了Sora視頻生成應用,同樣在五天內達成100萬用戶。
然而,關於OpenAI的討論熱度已不及ChatGPT剛亮相時。谷歌和Anthropic的競爭模型因技術能力獲得好評,而OpenAI的財務承諾開始讓華爾街擔憂。一些技術專家也質疑,大型語言模型是否能實現最前沿的AI願景。
在某些方面,問題依舊存在。紐約大學榮譽教授、著名心理學家加里·馬庫斯(Gary Marcus)表示,他在2022年底就提出了OpenAI系統的問題,但至今未解決。他指出:“它們會出現‘幻覺’,推理能力也有問題。”
競爭格局方面,馬庫斯去年12月曾預測,如果到2025年底沒有真正差異化的產品,OpenAI可能會失去其護城河。他補充道,現在OpenAI面臨的競爭對手推出了功能大致相當的產品,他指的是谷歌本月初發布的Gemini 3 AI模型。
賓夕法尼亞大學工程學院教授Benjamin Lee表示,過去幾年AI領域“活動如火如荼”,“我們看到大量實驗和用戶採納。”Gemini一度被認爲已被放棄,但今年以來積極爭奪市場份額。
本月,谷歌最新的Gemini 3和Nano Banana Pro更新再次令投資者和用戶印象深刻。馬庫斯稱:“谷歌曾落後很多,人們幾乎已不看好,但其最新模型可以說領先於GPT-5。”
Gemini 3在大多數關鍵AI基準測試中優於GPT-5,而Anthropic最新模型Claude Opus 4.5在代理編碼基準上擊敗了GPT-5和Gemini 3。Lee表示,這種技術上的競爭非常健康且令人興奮,但對OpenAI來說,這意味著不能僅靠先發優勢。
市場方面,11月關於AI泡沫的擔憂升溫,引發科技股拋售。OpenAI因在複雜AI融資網絡中的核心角色受到審視,公司已簽訂超過1.4萬億美元的AI基礎設施交易,投資者質疑AI實驗室如何履行這些承諾。
ChatGPT Pulse、Sora及網頁瀏覽器等新功能可能幫助業務擴張,但對谷歌而言,AI盈利並非核心問題,其搜索、雲計算、Android和企業軟件業務板塊能促進AI產品分發和規模化。
谷歌的定製芯片業務也在AI競賽中佔優勢,TPU芯片不僅用於訓練Gemini模型,也支撐搜索和YouTube算法。Anthropic本月表示計劃使用多達100萬個谷歌TPU來擴大算力,這也是OpenAI面臨的挑戰,因爲AI模型越來越大、越來越複雜。
大型語言模型(LLM)是否能通向通用AI(AGI)仍存疑問。隨著聊天機器人競爭加劇,越來越多AI研究者質疑LLM是否會成爲技術未來。畢竟,幻覺和推理漏洞並非ChatGPT獨有。
華爾街也擔心,缺乏完全自動化企業流程能力的聊天機器人,投資回報仍不明朗。LLM通過預測序列中下一個單詞或標記的概率工作,並不真正“知道”事實或理解邏輯。
馬庫斯指出:“它們並未真正抽象出對世界的穩定理解。”他和其他專家認爲,AI的新前沿是“世界模型”,即能夠在腦內模擬現實世界的AI。Axelar聯合創始人Sergey Gorbunov也認爲,世界模型可能比LLM更接近通用AI(AGI)。
與LLM不同,世界模型“能與物理空間互動”,因此可以“理解一些物理現象,而不僅僅是文本”。例如,它們能幫助提升自動駕駛能力,因爲車輛可以預測幾秒後其他車輛的行爲。
Gorbunov指出LLM存在兩大根本限制:依賴已有數據,以及本質上只是概率分佈。他稱:“從模型數學原理或構建方式看,它們只是可預測的概率分佈,根本不存在真正的AI。”
三年過去,紐約大學斯特恩商學院教授、《與機器思維》作者Vasant Dhar認爲,AI的根本變化在於,它在模擬理解方面更強,因此更易爲人接受。Dhar稱,ChatGPT三年的進步“令人驚歎”,但其對商業和生活的實際價值仍待觀察。
他強調,通用技術如電力和互聯網的採用歷來需要多年。Dhar預計未來一年兩年,ChatGPT和Gemini將有看似漸進但實際上意義重大的改進,影響用戶日常生活。
然而,Gorbunov表示,世界模型仍遠超當前AI行業水平。他預計未來幾個月,用戶通過AI驅動的網頁瀏覽器(如OpenAI的Atlas和Perplexity的Comet)與網絡的交互將成爲競爭焦點,谷歌也將在其中角逐,他認爲:
“誰能在用戶體驗上勝出,就能捕獲大量流量。”