xAI 一年虧 64 億、OpenAI 燒不出獲利、NVIDIA 一季淨賺 583 億——AI 鏈條真正賺錢的位置
2026 年 5 月 20 日這一天,三條財經新聞在同一時間冒出來。 第一條:NVIDIA 公布 FY27 Q1 財報——單季營收 816 億美元(+85% YoY)、淨利 583 億美元(+211%)、毛利率 74.9%、宣布 800 億美元股票回購、預測下季 910 億美元營收。 第二條:SpaceX 提交 IPO 招股書,順帶揭露剛被併入的 xAI 2025 年財務——全年虧損 64 億美元,營收 32 億,CapEx 127 億。SpaceX + xAI 合併後 2025 全年淨虧 49.4 億。 第三條:CNBC 報導 OpenAI 最快本週五提交 IPO 招股書草案,目標 2026 年 9 月上市,私募估值 5000 億美元,但訓練 + 推理 CapEx 長期遠高於營收,是公開的賠錢業務。 三條新聞放在同一張表上,AI 鏈條真正賺錢的位置就一覽無遺了。所有做模型的公司都在燒錢,賣 GPU 的那家一季淨賺一個 OpenAI 估值 12% 的數字。...
黃仁勳叫 CS 畢業生去當電工——一週內三位 AI 老闆都在預告同一件事
上週五,黃仁勳在卡內基梅隆大學的畢業典禮上對 2026 屆資工系畢業生說了句話:電工和水管工比你們有前景。 他不是在開玩笑。兩天後微軟 AI 部門的 CEO Mustafa Suleyman 接受 Fortune 採訪,預測 18 個月內 AI 會自動化掉所有「坐在電腦前」的白領工作。同一天 Anthropic CEO Dario Amodei 在華爾街日報的 YouTube 頻道說,軟體成本會崩到接近零,數十年累積的職業結構會跟著消失。 一週之內三位 AI 圈最有話語權的人放話,方向高度一致。我們得認真看看他們在說什麼——以及我們自己該怎麼辦。 一週內的三個訊號5/15,黃仁勳 @ CMU:給資工系畢業生的演講,主軸是「不要假設你選了一個鐵飯碗」。他引用的數據夠扎實: Randstad 分析顯示,技工的需求增長是白領職位的 3 倍 機器人技術員職位增長 107% 斯坦福研究指出,AI 相關崗位的早期職業就業率下降 16% 頂級電工年薪可以超過 10.6 萬美元,而且不用揹學貸 科技公司今年砸了 7000 億美元蓋資料中心,到 2030 年全球估計 7...
AI 投資三年了,錢到底花到哪去了?從 Bloomberg 的靈魂拷問看開發者該知道的事
Bloomberg 今天丟出一篇標題很直白的文章:「AI 泡沫要破了嗎?」三年過去,華爾街自己都搞不定這個問題——有人說投資人低估了 AI,有人說砸進去的錢已經變成一顆定時炸彈。 我不是金融分析師,但身為一個每天跟 AI 工具打交道的開發者,我想從技術端的角度聊聊:錢到底去了哪裡,哪些地方看得到回報,哪些地方還在燒。 錢去了三個地方第一塊:算力基礎設施。 Jensen Huang 在 GTC 2026 說 Blackwell 加 Vera Rubin 的訂單量預計到 2027 年達到一兆美元。雲端合作夥伴的 GPU 總量突破 100 萬顆。這些錢是實打實花出去的——資料中心、電力、散熱、光纖。你用 Claude、GPT 或任何一個 AI 服務,背後都是這些硬體在撐。 第二塊:模型研發。 OpenAI、Anthropic、Google、xAI、DeepSeek——每家都在瘋狂燒錢訓練下一代模型。GPT-5.4 三個月內把推理效率提升 32 倍,Groq 3 LPU 的推理速度是 GPU 的 35...
你的 AI 帳單即將縮水 30 倍:一天之內 NVIDIA 和 OpenAI 同時給出的訊號
3 月 16 日晚上,兩件事同時發生。 Jensen Huang 在 GTC 主題演講上揭曉 Groq 3 LPU,宣稱每瓦 tokens 效能提升 35 倍。幾個小時後,Sam Altman 在 X 上發文:GPT-5.2 到 5.4,三個月內效率提升 32 倍,每個任務成本降到 37 美分。 兩家公司,一硬一軟,同一天給出幾乎相同的數字。這不是巧合。 硬體端:Groq 3 LPU 到底是什麼NVIDIA 在 2025 年底花 200 億美元買下 Groq 的核心團隊和技術。GTC 上第一次展示成果:Groq 3 LPU(Language Processing Unit),專門為推理設計的晶片。 跟 GPU 最大的差異在架構。GPU 用 HBM(高頻寬記憶體)做訓練和推理都行,但推理階段的記憶體存取模式跟訓練完全不同。LPU 用 SRAM 直接塞在晶片上,消除了記憶體瓶頸。結果就是:推理延遲極低,每瓦輸出的 tokens 數量暴增。 NVIDIA 的做法很聰明。LPX 機架裝 256 顆 LPU,設計成放在 Vera Rubin GPU 機架旁邊一起用。訓練用 GPU,推理用...
當銅線跑不動 AI:NVIDIA 花 40 億美元押注光子學,你的 GPU 叢集正在碰上物理極限
我在追蹤 NVIDIA GTC 2026 的預告資訊時,撞上一個讓我停下來想了很久的數字:2 公尺。 在 1.6 Tb/s 的傳輸速度下,銅線的訊號完整性和散熱問題,讓它連 2 公尺都撐不住。這不是理論推導,是工程實測。NVIDIA 在 3 月 2 日宣布砸 40 億美元投資 Lumentum 和 Coherent 兩家光子學公司,接著在 GTC 發表 Spectrum-X 和 Quantum-X 矽光子網路交換器。 銅線時代正在結束。如果你在管 AI 叢集,或者你的工作跟 GPU 運算基礎設施沾上邊,這件事值得花十分鐘搞懂。 問題出在哪:銅線碰上了物理牆GPU 跑得再快,資料傳不過去就是白搭。 現代 AI 訓練和推理的瓶頸早就不只在運算力。一個 NVL72 機架裡塞了 72 張 Rubin GPU,它們之間的資料交換量是天文數字。第六代 NVLink 的頻寬達到 260 TB/s,但這些資料要在 GPU 之間、機架之間、甚至跨資料中心移動。 銅線在低速時代不是問題。但當每個埠口要跑 1.6 Tb/s,物理定律就開始反咬: 訊號衰減:高頻電訊號在銅線裡跑得越遠,衰減越嚴重。2...
NVIDIA 不只賣 GPU 了:從 200 億 Groq 收購到 NemoClaw,黃仁勳怎麼蓋出 AI 全棧帝國
2026 年 3 月 16 日,NVIDIA GTC 大會在聖荷西 SAP Center 開幕。39,000 人從 190 個國家飛來,等著看黃仁勳穿皮夾克站上台講兩個小時。 但今年的 GTC 跟往年不一樣。往年你聽到的是「我們的新 GPU 比上一代快幾倍」。今年的主軸是:NVIDIA 已經不是一家 GPU 公司了。 200 億美元買下 Groq,買的不是公司2025 年底,NVIDIA 花了 200 億美元跟 Groq 簽了一份「非排他性授權協議」。說是授權,實際上 Groq 的創辦人 Jonathan Ross(Google TPU 的設計者)和 80% 的工程團隊都跑去 NVIDIA 了。Groq 名義上還在,GroqCloud 繼續營運,但核心技術和人才已經搬家。 CNBC 分析師直接說:這筆交易的結構是「維持競爭存在的假象」。 NVIDIA 買的是 Groq 的 LPU(Language Processing Unit)技術。LPU 專為推理設計,不跑訓練。它的架構跟 GPU 完全不同——沒有外部記憶體存取的瓶頸,推理延遲極低。 根據 GTC 前夕的報導,NVIDIA...
GTC 2026 前夕:Vera Rubin 架構與 NemoClaw 將如何改變 AI 開發者的日常
明天(3/16)Jensen Huang 會站上 SAP Center 的舞台,開始一場兩小時的主題演講。GTC 2026 不只是 NVIDIA 的年度大拜拜——今年的發布內容,可能會直接改變我們未來兩年寫程式的方式。 我花了幾天研究公開資料,整理出三個對開發者最有感的方向。 Vera Rubin:不只是「更快的 GPU」先說數字。Vera Rubin 架構的 GPU 擁有 3,360 億個電晶體,用台積電 3nm 製程,搭配 HBM4 記憶體。推理效能 50 PFLOPS(NVFP4),訓練 35 PFLOPS——分別是 Blackwell 的 5 倍和 3.5 倍。 但真正讓我注意的不是單顆 GPU 的數字,而是 NVL72 機架的規格:72 顆 Rubin GPU + 36 顆 Vera CPU,透過 NVLink 6 連接,每顆 GPU 有 3.6 TB/s 的雙向頻寬,整個機架的 scale-up 頻寬達到 260 TB/s。 這意味著什麼? 以前跑大型模型需要跨節點通訊,頻寬瓶頸讓 pipeline parallelism 變成必修課。260 TB/s 的...
NVIDIA 要做自己的 AI Agent 平台了:NemoClaw 技術架構解讀與開發者該注意的三件事
上週 CNBC 報導 NVIDIA 正在打造一個叫 NemoClaw 的開源 AI agent 平台,目標是企業市場。三天後,GTC 2026 就要開幕了。Jensen Huang 的主題演講排在 3/16 上午 11 點(太平洋時間),市場預期他會在那裡正式發布這東西。 我花了一些時間把目前流出的資訊整理了一遍,想搞清楚這個平台跟現有的 AI agent 方案(OpenClaw、Dify、LangChain)到底有什麼不同,以及對我們這些寫程式的人來說,真正值得關注的是什麼。 NemoClaw 是什麼一句話:NVIDIA 把自家的 NeMo 框架、Nemotron 模型系列和 NIM 推理微服務打包成一個企業級 AI agent 平台,然後開源。 聽起來很普通,但有幾個細節值得注意。 硬體不綁定。 NemoClaw 可以跑在 NVIDIA GPU 上,也可以跑在 AMD、Intel 和其他處理器上。一家以賣 GPU 為主要商業模式的公司,做了一個不強制要求用自家硬體的平台——這個決定背後的戰略考量很有意思。 企業安全優先。 跟 OpenClaw 這類個人向的 agent...
