AI 投資三年了,錢到底花到哪去了?從 Bloomberg 的靈魂拷問看開發者該知道的事
Bloomberg 今天丟出一篇標題很直白的文章:「AI 泡沫要破了嗎?」三年過去,華爾街自己都搞不定這個問題——有人說投資人低估了 AI,有人說砸進去的錢已經變成一顆定時炸彈。 我不是金融分析師,但身為一個每天跟 AI 工具打交道的開發者,我想從技術端的角度聊聊:錢到底去了哪裡,哪些地方看得到回報,哪些地方還在燒。 錢去了三個地方第一塊:算力基礎設施。 Jensen Huang 在 GTC 2026 說 Blackwell 加 Vera Rubin 的訂單量預計到 2027 年達到一兆美元。雲端合作夥伴的 GPU 總量突破 100 萬顆。這些錢是實打實花出去的——資料中心、電力、散熱、光纖。你用 Claude、GPT 或任何一個 AI 服務,背後都是這些硬體在撐。 第二塊:模型研發。 OpenAI、Anthropic、Google、xAI、DeepSeek——每家都在瘋狂燒錢訓練下一代模型。GPT-5.4 三個月內把推理效率提升 32 倍,Groq 3 LPU 的推理速度是 GPU 的 35...
你的 AI 帳單即將縮水 30 倍:一天之內 NVIDIA 和 OpenAI 同時給出的訊號
3 月 16 日晚上,兩件事同時發生。 Jensen Huang 在 GTC 主題演講上揭曉 Groq 3 LPU,宣稱每瓦 tokens 效能提升 35 倍。幾個小時後,Sam Altman 在 X 上發文:GPT-5.2 到 5.4,三個月內效率提升 32 倍,每個任務成本降到 37 美分。 兩家公司,一硬一軟,同一天給出幾乎相同的數字。這不是巧合。 硬體端:Groq 3 LPU 到底是什麼NVIDIA 在 2025 年底花 200 億美元買下 Groq 的核心團隊和技術。GTC 上第一次展示成果:Groq 3 LPU(Language Processing Unit),專門為推理設計的晶片。 跟 GPU 最大的差異在架構。GPU 用 HBM(高頻寬記憶體)做訓練和推理都行,但推理階段的記憶體存取模式跟訓練完全不同。LPU 用 SRAM 直接塞在晶片上,消除了記憶體瓶頸。結果就是:推理延遲極低,每瓦輸出的 tokens 數量暴增。 NVIDIA 的做法很聰明。LPX 機架裝 256 顆 LPU,設計成放在 Vera Rubin GPU 機架旁邊一起用。訓練用 GPU,推理用...
從 10 萬到 9700 萬下載:MCP 如何在 14 個月內變成 AI 工具連接的 USB
2024 年 11 月,Anthropic 發了一篇不起眼的公告,介紹一個叫 Model Context Protocol 的東西。SDK 月下載量大約 10 萬。 14 個月後的今天,MCP 月下載量 9,700 萬。970 倍。OpenAI、Google、Microsoft、AWS 全部原生支援。治理權捐給了 Linux Foundation 底下的 Agentic AI Foundation。 10 萬到 9,700 萬,一年多一點。我想聊聊這件事為什麼值得開發者認真看待。 問題不是技術,是膠水2024 年底的 AI 開發長這樣:你的 LLM 需要讀 GitHub issue,你寫一個 function call。需要查 Slack 訊息,再寫一個。需要讀資料庫,再來一個。每個整合都是客製化的,每換一個 LLM 供應商就要重寫一遍。 這跟 USB 出現之前的電腦周邊一模一樣。印表機用 parallel port,滑鼠用 serial port,鍵盤用 PS/2。每種設備一種接口,每種接口一個驅動程式。 MCP...
NVIDIA 不只賣 GPU 了:從 200 億 Groq 收購到 NemoClaw,黃仁勳怎麼蓋出 AI 全棧帝國
2026 年 3 月 16 日,NVIDIA GTC 大會在聖荷西 SAP Center 開幕。39,000 人從 190 個國家飛來,等著看黃仁勳穿皮夾克站上台講兩個小時。 但今年的 GTC 跟往年不一樣。往年你聽到的是「我們的新 GPU 比上一代快幾倍」。今年的主軸是:NVIDIA 已經不是一家 GPU 公司了。 200 億美元買下 Groq,買的不是公司2025 年底,NVIDIA 花了 200 億美元跟 Groq 簽了一份「非排他性授權協議」。說是授權,實際上 Groq 的創辦人 Jonathan Ross(Google TPU 的設計者)和 80% 的工程團隊都跑去 NVIDIA 了。Groq 名義上還在,GroqCloud 繼續營運,但核心技術和人才已經搬家。 CNBC 分析師直接說:這筆交易的結構是「維持競爭存在的假象」。 NVIDIA 買的是 Groq 的 LPU(Language Processing Unit)技術。LPU 專為推理設計,不跑訓練。它的架構跟 GPU 完全不同——沒有外部記憶體存取的瓶頸,推理延遲極低。 根據 GTC 前夕的報導,NVIDIA...
你選的程式語言,其實是 AI 替你選的:GitHub 數據揭露的便利迴圈
2025 年 8 月,TypeScript 在 GitHub 上超越 Python 和 JavaScript,成為平台上最多人使用的程式語言。一年內新增超過一百萬名貢獻者,成長幅度 66%。 這不是自然演化。這是 AI 在背後推了一把。 GitHub 的開發者倡導者 Andrea Griffiths 替這個現象取了一個名字:便利迴圈(Convenience Loop)。當 AI 讓某個技術用起來特別順手,開發者就會湧向它。湧入的開發者產出更多程式碼,這些程式碼成為 AI 的訓練資料,AI 對這個技術變得更強,吸引更多開發者。 迴圈就這樣轉起來了。而且停不下來。 TypeScript 為什麼是最大贏家一個數字就能說明問題:2025 年一項學術研究發現,LLM 產出的編譯錯誤中,94% 是型別檢查失敗。 想想這代表什麼。AI 寫的程式碼,十次編譯錯誤有九次以上是型別搞錯了。TypeScript 的型別系統就像一張安全網——你宣告了 x: string,AI 立刻知道該排除所有不適用於字串的操作。Python 的動態型別沒有這道防線,錯誤要到 runtime 才會爆開。 對 AI...
你的 AI 模型不需要永遠在思考:Phi-4-reasoning-vision 的思考開關機制拆解
上週我在測一個圖片分類 pipeline,用的是某個 70B 的多模態模型。每張圖片丟進去,模型都要「深呼吸」想個十幾秒,輸出一大段 chain-of-thought,最後才吐出一個分類標籤。 問題是,八成的圖片根本不需要推理。一張貓的照片,你不需要「讓我仔細分析這張圖片的像素分佈和語義特徵」,你只需要說「貓」。 Microsoft 在 3 月 4 日開源的 Phi-4-reasoning-vision-15B,做了一件我認為比「更大更強」更有價值的事:教模型判斷什麼時候該思考,什麼時候不該。 15B 參數做到了什麼先看數字。Phi-4-reasoning-vision-15B 在十個基準測試上的表現: AI2D(科學圖表):84.8 ChartQA(圖表問答):83.3 MathVista(數學視覺推理):75.2 ScreenSpot v2(UI 元素定位):88.2 MMMU(綜合多模態理解):54.3 這些分數追不上 Qwen3-VL-32B,但跟同量級的 Qwen3-VL-8B 和 Kimi-VL-A3B 比,持平甚至領先。重點是,Qwen...
AI Agent 框架大亂鬥:NemoClaw、OpenClaw 和開發者的真實選擇
老闆走過來說:「我看到競爭對手在用 AI Agent 自動處理客服了,我們也來做一個。」 你心裡的 OS 大概是:用哪個框架?LangChain?AutoGen?還是最近爆紅的 OpenClaw?明天 NVIDIA GTC 又要發布 NemoClaw,這局面到底怎麼選? 我花了一整晚研究目前的 AI Agent 框架生態,把我的觀察整理成這篇。不賣焦慮,只講開發者真正需要思考的問題。 數字先看:這不是 hype,但也不全是真的Gartner 和 Forrester 都把 2026 年標記為「多代理系統的突破年」。幾個關鍵數據: 57% 的企業已經有 AI Agent 在生產環境跑了(G2 調查) 40% 的企業應用預計會嵌入特定任務的 AI Agent 80% 的受訪者表示 AI Agent 已經產生可衡量的經濟影響 全球 Agentic AI 市場規模從 2026 年的 91.4 億美元,預計 2034 年達到 1,390 億美元 但 Gartner 同時預測:超過 40% 的 Agent 專案會在 2027...
GTC 2026 前夕:Vera Rubin 架構與 NemoClaw 將如何改變 AI 開發者的日常
明天(3/16)Jensen Huang 會站上 SAP Center 的舞台,開始一場兩小時的主題演講。GTC 2026 不只是 NVIDIA 的年度大拜拜——今年的發布內容,可能會直接改變我們未來兩年寫程式的方式。 我花了幾天研究公開資料,整理出三個對開發者最有感的方向。 Vera Rubin:不只是「更快的 GPU」先說數字。Vera Rubin 架構的 GPU 擁有 3,360 億個電晶體,用台積電 3nm 製程,搭配 HBM4 記憶體。推理效能 50 PFLOPS(NVFP4),訓練 35 PFLOPS——分別是 Blackwell 的 5 倍和 3.5 倍。 但真正讓我注意的不是單顆 GPU 的數字,而是 NVL72 機架的規格:72 顆 Rubin GPU + 36 顆 Vera CPU,透過 NVLink 6 連接,每顆 GPU 有 3.6 TB/s 的雙向頻寬,整個機架的 scale-up 頻寬達到 260 TB/s。 這意味著什麼? 以前跑大型模型需要跨節點通訊,頻寬瓶頸讓 pipeline parallelism 變成必修課。260 TB/s 的...
Anthropic 拒絕讓 AI 做武器,被美國政府列入黑名單:技術紅線背後的架構抉擇
3 月 9 日,Anthropic 同時在加州北區聯邦法院和華盛頓特區上訴法院提起訴訟,控告美國國防部違法將其列為「供應鏈風險」。原因很單純:CEO Dario Amodei 拒絕讓 Claude 被用於大規模監控美國公民,也拒絕讓它操控自主武器。 這不是一般的商業糾紛。這是一家估值數百億美元的 AI 公司,因為堅持技術紅線而被自己國家的軍方封殺。 兩條紅線Anthropic 和五角大廈的談判卡在兩個條款上: 禁止大規模監控:Claude 不能被用來對美國公民進行未經授權的大規模數據蒐集和分析 禁止自主武器:Claude 不能作為完全自主殺傷性武器的決策核心 Amodei 的立場很明確——這兩條不談。五角大廈的回應也很明確——那你就別做政府生意了。 2 月底,國防部正式將 Anthropic 列入「供應鏈風險」名單。這個標籤的殺傷力不只是失去國防合約,而是所有聯邦政府承包商在六個月內都必須停止使用 Claude。根據 Anthropic 的法庭文件,超過 100...
AI 比人類更會操作電腦了:GPT-5.4 Computer Use 技術拆解與開發者該注意的三件事
3 月 5 日,OpenAI 發布 GPT-5.4。大多數人的注意力被 1M token context window 和 Tool Search 搶走了,但我認為真正該被討論的是另一件事:Computer Use。 GPT-5.4 在 OSWorld 基準測試拿到 75.0% 的成功率。人類專家是 72.4%。 AI 操作電腦的成功率,正式超過人類了。 OSWorld 75%,這個數字為什麼重要先說清楚 OSWorld 在測什麼。它不是問 AI「怎麼操作試算表」然後看回答正不正確。它是真的把 AI 丟到一台有作業系統的電腦前面,給它任務,看它能不能完成。 任務長這樣: 「找到最近修改過的試算表並打開它」 「把 Wi-Fi 切換到辦公室網路」 「打開 Chrome,到某個網站,把這份表單填完」 都是你每天在做的事。而 GPT-5.4 做這些事的成功率,比被付錢來完美完成任務的人類測試員還高。 模型 OSWorld 成功率 與人類(72.4%)比較 GPT-5.4 75.0% +2.6% GPT-5.2 47.3% -25.1% 之前最佳...
