你的 AI 帳單即將縮水 30 倍:一天之內 NVIDIA 和 OpenAI 同時給出的訊號
3 月 16 日晚上,兩件事同時發生。 Jensen Huang 在 GTC 主題演講上揭曉 Groq 3 LPU,宣稱每瓦 tokens 效能提升 35 倍。幾個小時後,Sam Altman 在 X 上發文:GPT-5.2 到 5.4,三個月內效率提升 32 倍,每個任務成本降到 37 美分。 兩家公司,一硬一軟,同一天給出幾乎相同的數字。這不是巧合。 硬體端:Groq 3 LPU 到底是什麼NVIDIA 在 2025 年底花 200 億美元買下 Groq 的核心團隊和技術。GTC 上第一次展示成果:Groq 3 LPU(Language Processing Unit),專門為推理設計的晶片。 跟 GPU 最大的差異在架構。GPU 用 HBM(高頻寬記憶體)做訓練和推理都行,但推理階段的記憶體存取模式跟訓練完全不同。LPU 用 SRAM 直接塞在晶片上,消除了記憶體瓶頸。結果就是:推理延遲極低,每瓦輸出的 tokens 數量暴增。 NVIDIA 的做法很聰明。LPX 機架裝 256 顆 LPU,設計成放在 Vera Rubin GPU 機架旁邊一起用。訓練用 GPU,推理用...
