GTC 2026 前夕:Vera Rubin 架構與 NemoClaw 將如何改變 AI 開發者的日常
明天(3/16)Jensen Huang 會站上 SAP Center 的舞台,開始一場兩小時的主題演講。GTC 2026 不只是 NVIDIA 的年度大拜拜——今年的發布內容,可能會直接改變我們未來兩年寫程式的方式。 我花了幾天研究公開資料,整理出三個對開發者最有感的方向。 Vera Rubin:不只是「更快的 GPU」先說數字。Vera Rubin 架構的 GPU 擁有 3,360 億個電晶體,用台積電 3nm 製程,搭配 HBM4 記憶體。推理效能 50 PFLOPS(NVFP4),訓練 35 PFLOPS——分別是 Blackwell 的 5 倍和 3.5 倍。 但真正讓我注意的不是單顆 GPU 的數字,而是 NVL72 機架的規格:72 顆 Rubin GPU + 36 顆 Vera CPU,透過 NVLink 6 連接,每顆 GPU 有 3.6 TB/s 的雙向頻寬,整個機架的 scale-up 頻寬達到 260 TB/s。 這意味著什麼? 以前跑大型模型需要跨節點通訊,頻寬瓶頸讓 pipeline parallelism 變成必修課。260 TB/s 的...
