【緯來新聞網】輝達(NVIDIA)宣布與倫敦 AI 研究新創 Ineffable Intelligence 展開工程層級合作,雙方將共同打造大規模強化學習(Reinforcement Learning, RL)所需的下一代 AI 基礎設施。Ineffable 由 AlphaGo 核心架構師、前 Google DeepMind 研究員 David Silver 創立,主張 AI 下一階段不應只依賴人類既有資料訓練,而是讓系統透過試錯、模擬與經驗持續學習。

根據 NVIDIA 說法,傳統大型語言模型多以固定資料集進行預訓練,但強化學習工作負載會在訓練過程中即時產生資料,AI 代理必須不斷「行動、觀察、評分、更新」,因此對高速互連、記憶體頻寬與推論服務能力提出更高要求。雙方合作將從 NVIDIA Grace Blackwell 平台起步,並探索即將到來的 Vera Rubin 平台,目標是為能從經驗中學習的「superlearner」建立可擴展訓練管線。
Ineffable 於今年 4 月底宣布完成 11 億美元種子輪融資,投後估值達 51 億美元,由 Sequoia Capital 與 Lightspeed Venture Partners 共同領投,NVIDIA、Google 等參與。外媒報導指出,這是歐洲迄今最大規模的種子輪融資。
NVIDIA 指出,強化學習工作負載不同於傳統預訓練,會在訓練過程中即時產生資料,系統必須在密集循環中持續採取行動、觀察、評分並更新,因而對互連、記憶體頻寬與推論服務能力提出更高要求。雙方合作將從 NVIDIA Grace Blackwell 平台展開,並成為首批探索即將推出的 NVIDIA Vera Rubin 平台的專案之一,目標是建立可支援大規模強化學習系統的訓練管線,讓 AI 代理能在高度複雜且豐富的環境中,透過經驗學習並在各知識領域發現突破。

文章語音朗讀