【緯來新聞網】Google 於今年四月發布全新量化壓縮演算法「TurboQuant」,因宣稱能在不影響效能的前提下將 AI 推論緩存大幅壓縮 6 倍,一度引發市場對硬體需求見頂的恐慌,並導致美國零售市場 DDR5 價格與相關類股快速修正。然而,經過一個多月的市場數據沉澱與驗證,半導體產業的長線質變才正要浮上檯面。

香港聚芯資本管理合夥人陳慧明(Eric)近日於緯來財經《投資聊一SHOT》節目中指出,多數外資券商與投資人僅看到技術帶來的短期硬體需求下修,卻忽略了更核心的「傑文斯悖論(Jevons Paradox)」與「Token 經濟學」效能。
陳慧明分析,Google 雖透過 PolarQuant(極座標量化)與 QJL(誤差消除)等工程優化降低了單一模型的記憶體依賴,但當 Token 運算成本因此出現幾何級數大跌、低延遲痛點被解決時,反而會全面觸發中小企業加速導入「代理式 AI(Agent AI)」等實務應用。從歷史定律來看,資源利用效率的提升,最終將以更龐大的應用體量,反向推升整體半導體與記憶體產業的總體長線需求。
陳慧明更進一步透露,目前全球工程優化最密集的區域其實在中國大陸。以智譜與 MiniMax 為例,其 Token 成本極低,MiniMax 甚至僅有 Anthropic Claude Pro 的 5% 至 6%。這種由軟體架構驅動的降本增效,正成為全球催化全新硬體需求的重要引擎。
針對台灣記憶體大廠南亞科日前高達 787 億元的私募案,引進鎧俠(Kioxia)、Sandisk、SK海力士及思科(Cisco)等美、日、韓四國科技巨頭歷史性同時入股,陳慧明認為,在市場雜音沉澱後,全球巨頭直接用資金「提前綁定關鍵產能」的舉動,正是對記憶體供需長線續航力投下的最強信任票。
當軟體優化讓 AI 成本大降,究竟是記憶體產業的毒藥還是下一波暴增需求的催化劑?歡迎點擊下方連結收看完整影片,「緯來財經YouTube」《投資聊一SHOT》,每周二、四上新片!

文章語音朗讀