2026 年 3 月 16 日,NVIDIA GTC 大會在聖荷西 SAP Center 開幕。39,000 人從 190 個國家飛來,等著看黃仁勳穿皮夾克站上台講兩個小時。

但今年的 GTC 跟往年不一樣。往年你聽到的是「我們的新 GPU 比上一代快幾倍」。今年的主軸是:NVIDIA 已經不是一家 GPU 公司了。

200 億美元買下 Groq,買的不是公司

2025 年底,NVIDIA 花了 200 億美元跟 Groq 簽了一份「非排他性授權協議」。說是授權,實際上 Groq 的創辦人 Jonathan Ross(Google TPU 的設計者)和 80% 的工程團隊都跑去 NVIDIA 了。Groq 名義上還在,GroqCloud 繼續營運,但核心技術和人才已經搬家。

CNBC 分析師直接說:這筆交易的結構是「維持競爭存在的假象」。

NVIDIA 買的是 Groq 的 LPU(Language Processing Unit)技術。LPU 專為推理設計,不跑訓練。它的架構跟 GPU 完全不同——沒有外部記憶體存取的瓶頸,推理延遲極低。

根據 GTC 前夕的報導,NVIDIA 預計在今天的主題演講上公佈融合 GPU 和 LPU 技術的新推理晶片。OpenAI 是首發客戶,分配了 3 GW 的專用推理算力。

3 GW。一座核電廠大約 1 GW。OpenAI 光推理就要用掉三座核電廠的電力。

訓練是過去式,推理才是印鈔機

為什麼 NVIDIA 花 200 億買推理技術?

訓練一個大型語言模型是一次性的事。GPT-5.4 訓練完就訓練完了。但每一次你問 ChatGPT「今天天氣怎麼樣」,後面就跑了一次推理。OpenAI 的 900M 週活用戶,每個人每天可能跑幾十次推理。

訓練的算力需求是突發的。推理的算力需求是持續的、而且隨用戶增長指數擴大。

NVIDIA 顯然算過這筆帳:訓練市場有天花板,推理市場沒有。買下 Groq 的 LPU 技術,等於拿到了推理市場的入場券——而且是一張跟自家 GPU 不衝突的入場券。GPU 繼續賣訓練,LPU 專攻推理,客戶兩邊都得買。

NemoClaw:不只賣硬體,還要賣整條生產線

光有晶片不夠。NVIDIA 同時準備在 GTC 上發佈 NemoClaw——一個開源的企業級 AI Agent 平台。

NemoClaw 整合了三樣東西:

  • NeMo:模型訓練和 agent 推理流水線
  • Nemotron:NVIDIA 自家的模型系列(Nemotron 3 Super 已經在 Perplexity 上線了)
  • NIM:推理微服務,負責部署

NVIDIA 已經在向 Salesforce、Cisco、Google、Adobe、CrowdStrike 推銷這個平台。因為是開源的,合作夥伴免費用,條件是貢獻程式碼。

跟 OpenClaw 的差別?OpenClaw 是社群驅動的,誰都能跑。NemoClaw 強調的是企業級的安全、合規、和 NVIDIA 生態系統的整合。你用 NemoClaw,自然就綁進了 NVIDIA 的硬體和推理服務。

這招很聰明。OpenClaw 證明了市場需要 AI Agent 平台(GitHub 210K+ stars),NemoClaw 接住企業端的需求——那些在乎 SOC 2 合規、在乎 SLA、在乎「出問題找誰負責」的客戶。

五層蛋糕:從電力到應用

GTC 開幕前,NVIDIA 官方帳號發了一段影片,講的是「AI 經濟的五層結構」:

  1. 能源層:電力、冷卻
  2. 晶片層:GPU(訓練)+ LPU(推理)+ CPU(agentic 工作負載)
  3. 基礎設施層:NVLink、機架、AI 工廠
  4. 模型層:Nemotron、NIM
  5. 應用層:NemoClaw、agent 平台

NVIDIA 現在每一層都有產品。

GTC 預計還會發佈「agentic-optimized CPU」和 CPU-only 機架。意思是 NVIDIA 連 ARM CPU 都要自己做了,專門跑 AI Agent 的控制邏輯。GPU 跑模型推理,LPU 跑低延遲推理,CPU 跑 Agent 邏輯編排。一台機架裡面三種處理器各司其職。

微軟的 Satya Nadella 3 月 13 日宣布 Azure 是第一個完成 Vera Rubin NVL72 驗證的雲端供應商。Vera Rubin NVL72 是什麼?72 顆 Rubin GPU + 36 顆 Vera CPU,用第六代 NVLink 連接,頻寬 260 TB/s,算力 3.6 exaflops。AWS 和 GCP 要到 2026 下半年才能部署。

3.6 exaflops。NVIDIA 在 2020 年出的 A100,單卡 FP16 算力是 312 TFLOPS。一個 NVL72 機架的算力相當於 11,538 張 A100。六年,四個數量級。

開發者該注意什麼

如果你是寫應用的開發者,NemoClaw 值得關注。它可能會成為企業部署 AI Agent 的事實標準。跟 MCP(Model Context Protocol)一樣,這類平台一旦被大廠採用,生態系統會快速成形。

如果你做 infra,Groq 的 LPU 技術進入 NVIDIA 生態意味著推理成本會繼續下降。NVL72 的推理成本比 Blackwell 低 10 倍,再加上 LPU 技術加持,推理的邊際成本會趨近零。這對 API 定價和應用架構都有影響。

如果你做晶片或硬體,NVIDIA 從 GPU 擴展到 CPU 和 LPU 的動作說明一件事:它不打算讓任何一塊 AI 硬體市場留給別人。Intel 還在整理 Arrow Lake 的殘局,AMD 的 MI400 在追趕 Blackwell,NVIDIA 已經在蓋下一代的全棧機架了。

不是結論

GTC 的主題演講今天下午(台灣時間 3/17 凌晨 2 點)才要開始。上面寫的都是根據已公開的預告和洩漏。黃仁勳的演講通常會有沒人預料到的東西。

但方向已經很清楚了:NVIDIA 不再是一家賣顯示卡的公司,甚至不再是一家賣 GPU 的公司。它在蓋的是 AI 時代的完整基礎設施——從發電廠到你手上的 AI Agent。

如果你還在用「GPU 廠商」來理解 NVIDIA,是時候更新你的心智模型了。