kyosora 筆記

xAI 一年虧 64 億、OpenAI 燒不出獲利、NVIDIA 一季淨賺 583 億——AI 鏈條真正賺錢的位置

發表於2026-05-21|AI產業觀察職涯與反思

2026 年 5 月 20 日這一天，三條財經新聞在同一時間冒出來。第一條：NVIDIA 公布 FY27 Q1 財報——單季營收 816 億美元（+85% YoY）、淨利 583 億美元（+211%）、毛利率 74.9%、宣布 800 億美元股票回購、預測下季 910 億美元營收。第二條：SpaceX 提交 IPO 招股書，順帶揭露剛被併入的 xAI 2025 年財務——全年虧損 64 億美元，營收 32 億，CapEx 127 億。SpaceX + xAI 合併後 2025 全年淨虧 49.4 億。第三條：CNBC 報導 OpenAI 最快本週五提交 IPO 招股書草案，目標 2026 年 9 月上市，私募估值 5000 億美元，但訓練 + 推理 CapEx 長期遠高於營收，是公開的賠錢業務。三條新聞放在同一張表上，AI 鏈條真正賺錢的位置就一覽無遺了。所有做模型的公司都在燒錢，賣 GPU 的那家一季淨賺一個 OpenAI 估值 12% 的數字。這個對比值得單獨拆一篇。三家公司同一年的數字攤開先把三組數字釘在桌上：公司期間營收利潤/虧損補充 N...

黃仁勳叫 CS 畢業生去當電工——一週內三位 AI 老闆都在預告同一件事

發表於2026-05-18|AI工具實戰AI產業觀察

上週五，黃仁勳在卡內基梅隆大學的畢業典禮上對 2026 屆資工系畢業生說了句話：電工和水管工比你們有前景。他不是在開玩笑。兩天後微軟 AI 部門的 CEO Mustafa Suleyman 接受 Fortune 採訪，預測 18 個月內 AI 會自動化掉所有「坐在電腦前」的白領工作。同一天 Anthropic CEO Dario Amodei 在華爾街日報的 YouTube 頻道說，軟體成本會崩到接近零，數十年累積的職業結構會跟著消失。一週之內三位 AI 圈最有話語權的人放話，方向高度一致。我們得認真看看他們在說什麼——以及我們自己該怎麼辦。一週內的三個訊號5/15，黃仁勳 @ CMU：給資工系畢業生的演講，主軸是「不要假設你選了一個鐵飯碗」。他引用的資料夠扎實： Randstad 分析顯示，技工的需求增長是白領職位的 3 倍機器人技術員職位增長 107% 史丹佛研究指出，AI 相關崗位的早期職業就業率下降 16% 頂級電工年薪可以超過 10.6 萬美元，而且不用揹學貸科技公司今年砸了 7000 億美元蓋資料中心，到 2030 年全球估計 7 兆美元問題是製造業缺工...

AI 投資三年了，錢到底花到哪去了？從 Bloomberg 的靈魂拷問看開發者該知道的事

發表於2026-03-19|AI工具實戰AI產業觀察

Bloomberg 今天丟出一篇標題很直白的文章：「AI 泡沫要破了嗎？」三年過去，華爾街自己都搞不定這個問題——有人說投資人低估了 AI，有人說砸進去的錢已經變成一顆定時炸彈。我不是金融分析師，但身為一個每天跟 AI 工具打交道的開發者，我想從技術端的角度聊聊：錢到底去了哪裡，哪些地方看得到回報，哪些地方還在燒。錢去了三個地方第一塊：算力基礎設施。 Jensen Huang 在 GTC 2026 說 Blackwell 加 Vera Rubin 的訂單量預計到 2027 年達到一兆美元。雲端合作夥伴的 GPU 總量突破 100 萬顆。這些錢是實打實花出去的——資料中心、電力、散熱、光纖。你用 Claude、GPT 或任何一個 AI 服務，背後都是這些硬體在撐。第二塊：模型研發。 OpenAI、Anthropic、Google、xAI、DeepSeek——每家都在瘋狂燒錢訓練下一代模型。GPT-5.4 三個月內把推理效率提升 32 倍，Groq 3 LPU 的推理速度是 GPU 的 35 倍。這些進步是真的，但訓練一個前沿模型的成本也是真的——動輒數億美元。第三塊：應用層...

你的 AI 帳單即將縮水 30 倍：一天之內 NVIDIA 和 OpenAI 同時給出的訊號

發表於2026-03-17|AI工具實戰系統與維運

3 月 16 日晚上，兩件事同時發生。 Jensen Huang 在 GTC 主題演講上揭曉 Groq 3 LPU，宣稱每瓦 tokens 效能提升 35 倍。幾個小時後，Sam Altman 在 X 上發文：GPT-5.2 到 5.4，三個月內效率提升 32 倍，每個任務成本降到 37 美分。兩家公司，一硬一軟，同一天給出幾乎相同的數字。這不是巧合。硬體端：Groq 3 LPU 到底是什麼NVIDIA 在 2025 年底花 200 億美元買下 Groq 的核心團隊和技術。GTC 上第一次展示成果：Groq 3 LPU（Language Processing Unit），專門為推理設計的晶片。跟 GPU 最大的差異在架構。GPU 用 HBM（高頻寬記憶體）做訓練和推理都行，但推理階段的記憶體存取模式跟訓練完全不同。LPU 用 SRAM 直接塞在晶片上，消除了記憶體瓶頸。結果就是：推理延遲極低，每瓦輸出的 tokens 數量暴增。 NVIDIA 的做法很聰明。LPX 機架裝 256 顆 LPU，設計成放在 Vera Rubin GPU 機架旁邊一起用。訓練用 GPU，推理用 ...

當銅線跑不動 AI：NVIDIA 花 40 億美元押注光子學，你的 GPU 叢集正在碰上物理極限

發表於2026-03-16|AI產業觀察系統與維運

我在追蹤 NVIDIA GTC 2026 的預告資訊時，撞上一個讓我停下來想了很久的數字：2 公尺。在 1.6 Tb/s 的傳輸速度下，銅線的訊號完整性和散熱問題，讓它連 2 公尺都撐不住。這不是理論推導，是工程實測。NVIDIA 在 3 月 2 日宣布砸 40 億美元投資 Lumentum 和 Coherent 兩家光子學公司，接著在 GTC 發表 Spectrum-X 和 Quantum-X 矽光子網路交換器。銅線時代正在結束。如果你在管 AI 叢集，或者你的工作跟 GPU 運算基礎設施沾上邊，這件事值得花十分鐘搞懂。問題出在哪：銅線碰上了物理牆GPU 跑得再快，資料傳不過去就是白搭。現代 AI 訓練和推理的瓶頸早就不只在運算力。一個 NVL72 機架裡塞了 72 張 Rubin GPU，它們之間的資料交換量是天文數字。第六代 NVLink 的頻寬達到 260 TB/s，但這些資料要在 GPU 之間、機架之間、甚至跨資料中心移動。銅線在低速時代不是問題。但當每個埠口要跑 1.6 Tb/s，物理定律就開始反咬：訊號衰減：高頻電訊號在銅線裡跑得越遠，衰減越嚴重。2 ...

NVIDIA 不只賣 GPU 了：從 200 億 Groq 收購到 NemoClaw，黃仁勳怎麼蓋出 AI 全棧帝國

發表於2026-03-16|AI工具實戰AI產業觀察

2026 年 3 月 16 日，NVIDIA GTC 大會在聖荷西 SAP Center 開幕。39,000 人從 190 個國家飛來，等著看黃仁勳穿皮夾克站上台講兩個小時。但今年的 GTC 跟往年不一樣。往年你聽到的是「我們的新 GPU 比上一代快幾倍」。今年的主軸是：NVIDIA 已經不是一家 GPU 公司了。 200 億美元買下 Groq，買的不是公司2025 年底，NVIDIA 花了 200 億美元跟 Groq 簽了一份「非排他性授權協議」。說是授權，實際上 Groq 的創辦人 Jonathan Ross（Google TPU 的設計者）和 80% 的工程團隊都跑去 NVIDIA 了。Groq 名義上還在，GroqCloud 繼續營運，但核心技術和人才已經搬家。 CNBC 分析師直接說：這筆交易的結構是「維持競爭存在的假象」。 NVIDIA 買的是 Groq 的 LPU（Language Processing Unit）技術。LPU 專為推理設計，不跑訓練。它的架構跟 GPU 完全不同——沒有外部記憶體存取的瓶頸，推理延遲極低。根據 GTC 前夕的報導，NVIDIA ...

GTC 2026 前夕：Vera Rubin 架構與 NemoClaw 將如何改變 AI 開發者的日常

發表於2026-03-15|AI工具實戰AI產業觀察

明天（3/16）Jensen Huang 會站上 SAP Center 的舞台，開始一場兩小時的主題演講。GTC 2026 不只是 NVIDIA 的年度大拜拜——今年的發布內容，可能會直接改變我們未來兩年寫程式的方式。我花了幾天研究公開資料，整理出三個對開發者最有感的方向。 Vera Rubin：不只是「更快的 GPU」先說數字。Vera Rubin 架構的 GPU 擁有 3,360 億個電晶體，用台積電 3nm 製程，搭配 HBM4 記憶體。推理效能 50 PFLOPS（NVFP4），訓練 35 PFLOPS——分別是 Blackwell 的 5 倍和 3.5 倍。但真正讓我眼睛一亮的，是 NVL72 機架的規格：72 顆 Rubin GPU + 36 顆 Vera CPU，透過 NVLink 6 連接，每顆 GPU 有 3.6 TB/s 的雙向頻寬，整個機架的 scale-up 頻寬達到 260 TB/s。這意味著什麼？以前跑大型模型需要跨節點通訊，頻寬瓶頸讓 pipeline parallelism 變成必修課。260 TB/s 的 scale-up 頻寬把 72 ...

NVIDIA 要做自己的 AI Agent 平台了：NemoClaw 技術架構解讀與開發者該注意的三件事

發表於2026-03-14|AI工具實戰工具與生產力

上週 CNBC 報導 NVIDIA 正在打造一個叫 NemoClaw 的開源 AI agent 平台，目標是企業市場。三天後，GTC 2026 就要開幕了。Jensen Huang 的主題演講排在 3/16 上午 11 點（太平洋時間），市場預期他會在那裡正式發布這東西。我花了一些時間把目前流出的資訊整理了一遍，想搞清楚這個平台跟現有的 AI agent 方案（OpenClaw、Dify、LangChain）到底有什麼不同，以及對我們這些寫程式的人來說，真正值得關注的是什麼。 NemoClaw 是什麼一句話：NVIDIA 把自家的 NeMo 框架、Nemotron 模型系列和 NIM 推理微服務打包成一個企業級 AI agent 平台，然後開源。聽起來很普通，但有幾個細節值得注意。硬體不綁定。 NemoClaw 可以跑在 NVIDIA GPU 上，也可以跑在 AMD、Intel 和其他處理器上。一家以賣 GPU 為主要商業模式的公司，做了一個不強制要求用自家硬體的平台——這個決定背後的戰略考量很有意思。企業安全優先。跟 OpenClaw 這類個人向的 agent 平台不...