黃仁勳GTC演講:推理時代到來,2027營收至少萬億美元
英偉達(NVDA)首席執行官黃仁勳週一在該公司年度GTC大會上宣告“推理時代”(Age of Inference)的到來,並推出大量軟硬件新產品,旨在讓AI模型運行得更快、更高效。
在聖何塞鯊魚曲棍球隊主場SAP中心面對逾3萬名觀衆,黃仁勳揭曉了英偉達的新旗艦產品。他稱,這款產品將徹底改變“推理”——即允許模型響應用戶查詢的AI計算形式。
多年來,英偉達一直主導著圖形處理器(GPU)市場。這種強大的芯片被用於訓練大多數大型AI模型。但在過去一年裏,隨著AI公司迅速推進其模型及基於模型構建的AI工具的商業化,客戶要求獲得更適合推理計算而非訓練的更好芯片。
這款名爲英偉達Groq 3 LPX機架的新型服務器,將72臺英偉達下一代Vera Rubin服務器與256塊名爲LPU的新型芯片相結合。LPU由Groq公司開發,英偉達在去年12月通過一項200億美元的技術授權交易收購了該公司的核心領導團隊。
“這就是AI的未來。這就是AI想要去的方向,”黃仁勳表示。“它專爲推理而設計,只服務於這一種工作負載。而這種工作負載正是驅動AI工廠的動力。”
英偉達表示,這款新系統每秒可生成7億個token——這是計算度量的基本單位——其計算速度是英偉達上一代Hopper GPU的350倍。
在過去一年的大部分時間裏,黃仁勳一直在暗示,英偉達未來將越來越專注於推理計算。該公司的傳統GPU通常不被認爲是推理的理想選擇,因爲它們能耗巨大,且沒有足夠的內置內存讓模型訪問其訓練所依賴的海量數據。
新的Vera Rubin與Groq組合服務器將擁有比Hopper一代多500倍的高帶寬內存,有助於解決內存瓶頸問題。
“推理的拐點已經到來,”黃仁勳在主題演講中表示。“這就是祕訣所在。”
黃仁勳表示,英偉達預計到2027年底將售出價值1萬億美元的Blackwell和Rubin芯片,這更新了此前到2026年底售出5000億美元的預測。
黃仁勳在演講中還宣佈了一系列旨在加強英偉達在“數字孿生”和其他類型模擬設計領域業務的合作伙伴關係。該公司還宣佈成立一個由Cursor、Mistral、Perplexity、Reflection和Thinking Machines等軟件公司組成的聯盟,旨在降低開發前沿開源AI模型的難度。
黃仁勳表示,該聯盟的工作將把企業軟件工具的開發推入快車道,助力全球軟件即服務行業加速轉型爲智能體AI即服務行業。
就在黃仁勳演講之際,英偉達投資的英國雲計算初創公司Nscale宣佈,將在西弗吉尼亞州使用新的Vera Rubin服務器構建一個1.35千兆瓦的數據中心集羣。該公司將該項目稱爲“Monarch計算園區”,並稱其爲全球最大的AI計算設施之一。
英偉達還宣佈擴大其自動駕駛業務,包括爲其自動駕駛出租車計算系統新增四家合作伙伴——比亞迪印度公司、中國的吉利汽車、現代汽車和日產汽車。黃仁勳表示,藉助英偉達的芯片和模擬模型,這些汽車製造商有望顯著增加道路上的自動駕駛共享汽車數量。
演講接近尾聲時,由英偉達、DeepMind和迪士尼合作設計的、來自迪士尼《冰雪奇緣》動畫系列的雪人“奧拉夫”機器人版本蹣跚著走上舞臺,與黃仁勳就其Omniverse部門進行了一段生硬的對話。該部門負責爲機器人等產品開發物理AI。
“你是在Omniverse裏面學會走路的,”黃仁勳告訴機器人。
“我真的很喜歡走路!”它熱情地回應道。
“你們能想象嗎?”黃仁勳在離場前問道。“迪士尼樂園的未來:所有這些機器人,所有這些角色到處走動。”