跳到主要內容
:::
  1. 首頁
  2. 全球財經
  3. 最新

谷歌“TurboQuant”橫空出世:內存需求要崩?還是AI

schedule 2026/03/26 18:13:03

在人工智能基礎設施持續擴張、存儲芯片供需緊張的背景下,一項來自谷歌的技術突破,正在引發資本市場對行業邏輯的重新評估。

近日,谷歌發佈名爲TurboQuant的內存壓縮算法,宣稱可在不損失模型精度的情況下,將大語言模型運行所需的內存佔用降低至少六倍,並在部分測試中實現約八倍性能提升。

這一技術直指當前AI計算中的核心瓶頸——高維向量帶來的“緩存佔用壓力”,通過改進向量量化方法,在壓縮數據體積的同時維持計算精度。

需求預期擾動引發股價回調

受該消息影響,全球存儲與內存產業鏈公司股價普遍承壓。包括美光科技(MU.O)、西部數據(WDC.O)以及閃迪(SNDK.O)等企業股價出現下跌,市場擔憂未來單位算力所需內存規模下降,從而削弱行業需求基礎。

這一反應並非孤立事件。過去一年,在生成式AI需求推動下,內存芯片價格持續上漲,行業甚至出現階段性供應緊張。 在此背景下,任何可能“提高效率、降低硬件需求”的技術突破,均容易觸發市場對需求拐點的敏感預期。

效率革命而非需求替代

從技術路徑看,TurboQuant屬於經典“向量量化”方法的迭代升級。其核心在於通過兩階段壓縮機制,在減少數據維度的同時消除量化誤差,從而實現“高壓縮率+零精度損失”的目標。

這一改進意味著,在相同硬件條件下,AI模型可以處理更長上下文或更大批量任務,本質上提升的是“單位算力產出效率”,而非直接替代硬件本身。

傑文斯悖論再度成爲解釋框架

圍繞該技術的產業影響,市場迅速形成分歧。一部分投資者擔憂,若單次任務所需內存下降,將直接壓縮硬件需求;但主流投行與部分分析師則引用“傑文斯悖論”提出相反判斷。

該理論認爲,技術效率提升往往不會減少資源消耗,反而可能因成本下降而刺激更大規模需求擴張。

在AI場景中,更低的算力成本意味著模型部署門檻降低、應用場景擴展,從而帶動總體計算與存儲需求進一步增長。

市場已有類似先例。此前中國低成本大模型方案曾引發“高端算力需求下降”的擔憂,但隨後行業需求反而加速擴張,驗證效率提升與需求增長之間的正反饋關係。

短期約束仍來自供給側

從基本面看,當前內存行業的核心矛盾仍在供給端。AI數據中心擴建、雲廠商資本開支上行,使得DRAM與NAND需求持續高位運行,供應緊張格局尚未明顯緩解。

因此,多數機構認爲,TurboQuant短期內難以改變行業供需結構,其影響更多體現在中長期效率曲線的重塑,而非立即削弱出貨量。

摩根士丹利分析師金尚勳(Shawn Kim)在報告中寫道,TurboQuant對超大規模雲服務提供商是利好,因爲其帶來了投資回報機會。他還補充稱,從長期來看,這項技術也可能有利於內存製造商,因爲“更低的每個token成本也可能帶來更高的產品採用需求”。

Ortus Advisors分析師安德魯·傑克遜(Andrew Jackson)在Smartkarma的一份報告中寫道,鑑於供應極度緊張,谷歌的這一進展“對需求的影響可能微乎其微”。

本文來源:
文章標籤
::: 群益證券 群益投顧 群益保險 群益投信 群益香港
期貨總公司:(02)2700-2888
台北市敦化南路二段97號B1
台中分公司:(04)2319-9909
台中市西屯區台灣大道2段633號3樓之6
通過A無障礙網頁檢測