NVIDIA 不只賣 GPU 了：從 200 億 Groq 收購到 NemoClaw，黃仁勳怎麼蓋出 AI 全棧帝國

2026 年 3 月 16 日，NVIDIA GTC 大會在聖荷西 SAP Center 開幕。39,000 人從 190 個國家飛來，等著看黃仁勳穿皮夾克站上台講兩個小時。

但今年的 GTC 跟往年不一樣。往年你聽到的是「我們的新 GPU 比上一代快幾倍」。今年的主軸是：NVIDIA 已經不是一家 GPU 公司了。

200 億美元買下 Groq，買的不是公司

2025 年底，NVIDIA 花了 200 億美元跟 Groq 簽了一份「非排他性授權協議」。說是授權，實際上 Groq 的創辦人 Jonathan Ross（Google TPU 的設計者）和 80% 的工程團隊都跑去 NVIDIA 了。Groq 名義上還在，GroqCloud 繼續營運，但核心技術和人才已經搬家。

CNBC 分析師直接說：這筆交易的結構是「維持競爭存在的假象」。

NVIDIA 買的是 Groq 的 LPU（Language Processing Unit）技術。LPU 專為推理設計，不跑訓練。它的架構跟 GPU 完全不同——沒有外部記憶體存取的瓶頸，推理延遲極低。

根據 GTC 前夕的報導，NVIDIA 預計在今天的主題演講上公佈融合 GPU 和 LPU 技術的新推理晶片。OpenAI 是首發客戶，分配了 3 GW 的專用推理算力。

3 GW。一座核電廠大約 1 GW。OpenAI 光推理就要用掉三座核電廠的電力。

訓練是過去式，推理才是印鈔機

為什麼 NVIDIA 花 200 億買推理技術？

訓練一個大型語言模型是一次性的事。GPT-5.4 訓練完就訓練完了。但每一次你問 ChatGPT「今天天氣怎麼樣」，後面就跑了一次推理。OpenAI 的 900M 週活使用者，每個人每天可能跑幾十次推理。

訓練的算力需求是突發的。推理的算力需求是持續的、而且隨用戶增長指數擴大。

NVIDIA 顯然算過這筆帳：訓練市場有天花板，推理市場沒有。買下 Groq 的 LPU 技術，等於拿到了推理市場的入場券——而且是一張跟自家 GPU 不衝突的入場券。GPU 繼續賣訓練，LPU 專攻推理，客戶兩邊都得買。

NemoClaw：不只賣硬體，還要賣整條生產線

光有晶片不夠。NVIDIA 同時準備在 GTC 上發佈 NemoClaw——一個開源的企業級 AI Agent 平台。

NemoClaw 整合了三樣東西：

NeMo：模型訓練和 agent 推理流水線
Nemotron：NVIDIA 自家的模型系列（Nemotron 3 Super 已經在 Perplexity 上線了）
NIM：推理微服務，負責部署

NVIDIA 已經在向 Salesforce、Cisco、Google、Adobe、CrowdStrike 推銷這個平台。因為是開源的，合作夥伴免費用，條件是貢獻程式碼。

跟 OpenClaw 的差別？OpenClaw 是社群驅動的，誰都能跑。NemoClaw 強調的是企業級的安全、合規、和 NVIDIA 生態系統的整合。你用 NemoClaw，自然就綁進了 NVIDIA 的硬體和推理服務。

這招很聰明。OpenClaw 證明了市場需要 AI Agent 平台（GitHub 210K+ stars），NemoClaw 接住企業端的需求——那些在乎 SOC 2 合規、在乎 SLA、在乎「出問題找誰負責」的客戶。

五層蛋糕：從電力到應用

GTC 開幕前，NVIDIA 官方帳號發了一段影片，講的是「AI 經濟的五層結構」：

能源層：電力、冷卻
晶片層：GPU（訓練）+ LPU（推理）+ CPU（agentic 工作負載）
基礎設施層：NVLink、機架、AI 工廠
模型層：Nemotron、NIM
應用層：NemoClaw、agent 平台

NVIDIA 現在每一層都有產品。

GTC 預計還會發佈「agentic-optimized CPU」和 CPU-only 機架。意思是 NVIDIA 連 ARM CPU 都要自己做了，專門跑 AI Agent 的控制邏輯。GPU 跑模型推理，LPU 跑低延遲推理，CPU 跑 Agent 邏輯編排。一台機架裡面三種處理器各司其職。

微軟的 Satya Nadella 3 月 13 日宣布 Azure 是第一個完成 Vera Rubin NVL72 驗證的雲端供應商。Vera Rubin NVL72 是什麼？72 顆 Rubin GPU + 36 顆 Vera CPU，用第六代 NVLink 連接，頻寬 260 TB/s，算力 3.6 exaflops。AWS 和 GCP 要到 2026 下半年才能部署。

3.6 exaflops。NVIDIA 在 2020 年出的 A100，單卡 FP16 算力是 312 TFLOPS。一個 NVL72 機架的算力相當於 11,538 張 A100。六年，四個數量級。

開發者該注意什麼

如果你是寫應用的開發者，NemoClaw 值得關注。它可能會成為企業部署 AI Agent 的事實標準。跟 MCP（Model Context Protocol）一樣，這類平台一旦被大廠採用，生態系統會快速成形。

如果你做 infra，Groq 的 LPU 技術進入 NVIDIA 生態意味著推理成本會繼續下降。NVL72 的推理成本比 Blackwell 低 10 倍，再加上 LPU 技術加持，推理的邊際成本會趨近零。這對 API 定價和應用架構都有影響。

如果你做晶片或硬體，NVIDIA 從 GPU 擴展到 CPU 和 LPU 的動作說明一件事：它不打算讓任何一塊 AI 硬體市場留給別人。Intel 還在整理 Arrow Lake 的殘局，AMD 的 MI400 在追趕 Blackwell，NVIDIA 已經在蓋下一代的全棧機架了。

不是結論

GTC 的主題演講今天下午（台灣時間 3/17 凌晨 2 點）才要開始。上面寫的都是根據已公開的預告和洩漏。黃仁勳的演講通常會有沒人預料到的東西。

但方向已經很清楚了：NVIDIA 不再是一家賣顯示卡的公司，甚至不再是一家賣 GPU 的公司。它在蓋的是 AI 時代的完整基礎設施——從發電廠到你手上的 AI Agent。

如果你還在用「GPU 廠商」來理解 NVIDIA，是時候更新你的心智模型了。