kyosora 筆記

AI 投資三年了，錢到底花到哪去了？從 Bloomberg 的靈魂拷問看開發者該知道的事

發表於2026-03-19|AI產業觀察

Bloomberg 今天丟出一篇標題很直白的文章：「AI 泡沫要破了嗎？」三年過去，華爾街自己都搞不定這個問題——有人說投資人低估了 AI，有人說砸進去的錢已經變成一顆定時炸彈。我不是金融分析師，但身為一個每天跟 AI 工具打交道的開發者，我想從技術端的角度聊聊：錢到底去了哪裡，哪些地方看得到回報，哪些地方還在燒。錢去了三個地方第一塊：算力基礎設施。 Jensen Huang 在 GTC 2026 說 Blackwell 加 Vera Rubin 的訂單量預計到 2027 年達到一兆美元。雲端合作夥伴的 GPU 總量突破 100 萬顆。這些錢是實打實花出去的——資料中心、電力、散熱、光纖。你用 Claude、GPT 或任何一個 AI 服務，背後都是這些硬體在撐。第二塊：模型研發。 OpenAI、Anthropic、Google、xAI、DeepSeek——每家都在瘋狂燒錢訓練下一代模型。GPT-5.4 三個月內把推理效率提升 32 倍，Groq 3 LPU 的推理速度是 GPU 的 35...

你的 AI 帳單即將縮水 30 倍：一天之內 NVIDIA 和 OpenAI 同時給出的訊號

發表於2026-03-17|AI基礎設施

3 月 16 日晚上，兩件事同時發生。 Jensen Huang 在 GTC 主題演講上揭曉 Groq 3 LPU，宣稱每瓦 tokens 效能提升 35 倍。幾個小時後，Sam Altman 在 X 上發文：GPT-5.2 到 5.4，三個月內效率提升 32 倍，每個任務成本降到 37 美分。兩家公司，一硬一軟，同一天給出幾乎相同的數字。這不是巧合。硬體端：Groq 3 LPU 到底是什麼NVIDIA 在 2025 年底花 200 億美元買下 Groq 的核心團隊和技術。GTC 上第一次展示成果：Groq 3 LPU（Language Processing Unit），專門為推理設計的晶片。跟 GPU 最大的差異在架構。GPU 用 HBM（高頻寬記憶體）做訓練和推理都行，但推理階段的記憶體存取模式跟訓練完全不同。LPU 用 SRAM 直接塞在晶片上，消除了記憶體瓶頸。結果就是：推理延遲極低，每瓦輸出的 tokens 數量暴增。 NVIDIA 的做法很聰明。LPX 機架裝 256 顆 LPU，設計成放在 Vera Rubin GPU 機架旁邊一起用。訓練用 GPU，推理用...

從 10 萬到 9700 萬下載：MCP 如何在 14 個月內變成 AI 工具連接的 USB

發表於2026-03-16|AI開發工具

2024 年 11 月，Anthropic 發了一篇不起眼的公告，介紹一個叫 Model Context Protocol 的東西。SDK 月下載量大約 10 萬。 14 個月後的今天，MCP 月下載量 9,700 萬。970 倍。OpenAI、Google、Microsoft、AWS 全部原生支援。治理權捐給了 Linux Foundation 底下的 Agentic AI Foundation。 10 萬到 9,700 萬，一年多一點。我想聊聊這件事為什麼值得開發者認真看待。問題不是技術，是膠水2024 年底的 AI 開發長這樣：你的 LLM 需要讀 GitHub issue，你寫一個 function call。需要查 Slack 訊息，再寫一個。需要讀資料庫，再來一個。每個整合都是客製化的，每換一個 LLM 供應商就要重寫一遍。這跟 USB 出現之前的電腦周邊一模一樣。印表機用 parallel port，滑鼠用 serial port，鍵盤用 PS/2。每種設備一種接口，每種接口一個驅動程式。 MCP...

NVIDIA 不只賣 GPU 了：從 200 億 Groq 收購到 NemoClaw，黃仁勳怎麼蓋出 AI 全棧帝國

發表於2026-03-16|AI晶片產業

2026 年 3 月 16 日，NVIDIA GTC 大會在聖荷西 SAP Center 開幕。39,000 人從 190 個國家飛來，等著看黃仁勳穿皮夾克站上台講兩個小時。但今年的 GTC 跟往年不一樣。往年你聽到的是「我們的新 GPU 比上一代快幾倍」。今年的主軸是：NVIDIA 已經不是一家 GPU 公司了。 200 億美元買下 Groq，買的不是公司2025 年底，NVIDIA 花了 200 億美元跟 Groq 簽了一份「非排他性授權協議」。說是授權，實際上 Groq 的創辦人 Jonathan Ross（Google TPU 的設計者）和 80% 的工程團隊都跑去 NVIDIA 了。Groq 名義上還在，GroqCloud 繼續營運，但核心技術和人才已經搬家。 CNBC 分析師直接說：這筆交易的結構是「維持競爭存在的假象」。 NVIDIA 買的是 Groq 的 LPU（Language Processing Unit）技術。LPU 專為推理設計，不跑訓練。它的架構跟 GPU 完全不同——沒有外部記憶體存取的瓶頸，推理延遲極低。根據 GTC 前夕的報導，NVIDIA...

你選的程式語言，其實是 AI 替你選的：GitHub 數據揭露的便利迴圈

發表於2026-03-16|AI開發工具

2025 年 8 月，TypeScript 在 GitHub 上超越 Python 和 JavaScript，成為平台上最多人使用的程式語言。一年內新增超過一百萬名貢獻者，成長幅度 66%。這不是自然演化。這是 AI 在背後推了一把。 GitHub 的開發者倡導者 Andrea Griffiths 替這個現象取了一個名字：便利迴圈（Convenience Loop）。當 AI 讓某個技術用起來特別順手，開發者就會湧向它。湧入的開發者產出更多程式碼，這些程式碼成為 AI 的訓練資料，AI 對這個技術變得更強，吸引更多開發者。迴圈就這樣轉起來了。而且停不下來。 TypeScript 為什麼是最大贏家一個數字就能說明問題：2025 年一項學術研究發現，LLM 產出的編譯錯誤中，94% 是型別檢查失敗。想想這代表什麼。AI 寫的程式碼，十次編譯錯誤有九次以上是型別搞錯了。TypeScript 的型別系統就像一張安全網——你宣告了 x: string，AI 立刻知道該排除所有不適用於字串的操作。Python 的動態型別沒有這道防線，錯誤要到 runtime 才會爆開。對 AI...

你的 AI 模型不需要永遠在思考：Phi-4-reasoning-vision 的思考開關機制拆解

發表於2026-03-15|AI模型架構

上週我在測一個圖片分類 pipeline，用的是某個 70B 的多模態模型。每張圖片丟進去，模型都要「深呼吸」想個十幾秒，輸出一大段 chain-of-thought，最後才吐出一個分類標籤。問題是，八成的圖片根本不需要推理。一張貓的照片，你不需要「讓我仔細分析這張圖片的像素分佈和語義特徵」，你只需要說「貓」。 Microsoft 在 3 月 4 日開源的 Phi-4-reasoning-vision-15B，做了一件我認為比「更大更強」更有價值的事：教模型判斷什麼時候該思考，什麼時候不該。 15B 參數做到了什麼先看數字。Phi-4-reasoning-vision-15B 在十個基準測試上的表現： AI2D（科學圖表）：84.8 ChartQA（圖表問答）：83.3 MathVista（數學視覺推理）：75.2 ScreenSpot v2（UI 元素定位）：88.2 MMMU（綜合多模態理解）：54.3 這些分數追不上 Qwen3-VL-32B，但跟同量級的 Qwen3-VL-8B 和 Kimi-VL-A3B 比，持平甚至領先。重點是，Qwen...

AI Agent 框架大亂鬥：NemoClaw、OpenClaw 和開發者的真實選擇

發表於2026-03-15|AI開發工具

老闆走過來說：「我看到競爭對手在用 AI Agent 自動處理客服了，我們也來做一個。」你心裡的 OS 大概是：用哪個框架？LangChain？AutoGen？還是最近爆紅的 OpenClaw？明天 NVIDIA GTC 又要發布 NemoClaw，這局面到底怎麼選？我花了一整晚研究目前的 AI Agent 框架生態，把我的觀察整理成這篇。不賣焦慮，只講開發者真正需要思考的問題。數字先看：這不是 hype，但也不全是真的Gartner 和 Forrester 都把 2026 年標記為「多代理系統的突破年」。幾個關鍵數據： 57% 的企業已經有 AI Agent 在生產環境跑了（G2 調查） 40% 的企業應用預計會嵌入特定任務的 AI Agent 80% 的受訪者表示 AI Agent 已經產生可衡量的經濟影響全球 Agentic AI 市場規模從 2026 年的 91.4 億美元，預計 2034 年達到 1,390 億美元但 Gartner 同時預測：超過 40% 的 Agent 專案會在 2027...

GTC 2026 前夕：Vera Rubin 架構與 NemoClaw 將如何改變 AI 開發者的日常

發表於2026-03-15|AI硬體架構

明天（3/16）Jensen Huang 會站上 SAP Center 的舞台，開始一場兩小時的主題演講。GTC 2026 不只是 NVIDIA 的年度大拜拜——今年的發布內容，可能會直接改變我們未來兩年寫程式的方式。我花了幾天研究公開資料，整理出三個對開發者最有感的方向。 Vera Rubin：不只是「更快的 GPU」先說數字。Vera Rubin 架構的 GPU 擁有 3,360 億個電晶體，用台積電 3nm 製程，搭配 HBM4 記憶體。推理效能 50 PFLOPS（NVFP4），訓練 35 PFLOPS——分別是 Blackwell 的 5 倍和 3.5 倍。但真正讓我注意的不是單顆 GPU 的數字，而是 NVL72 機架的規格：72 顆 Rubin GPU + 36 顆 Vera CPU，透過 NVLink 6 連接，每顆 GPU 有 3.6 TB/s 的雙向頻寬，整個機架的 scale-up 頻寬達到 260 TB/s。這意味著什麼？以前跑大型模型需要跨節點通訊，頻寬瓶頸讓 pipeline parallelism 變成必修課。260 TB/s 的...

Anthropic 拒絕讓 AI 做武器，被美國政府列入黑名單：技術紅線背後的架構抉擇

發表於2026-03-15|AI產業觀察

3 月 9 日，Anthropic 同時在加州北區聯邦法院和華盛頓特區上訴法院提起訴訟，控告美國國防部違法將其列為「供應鏈風險」。原因很單純：CEO Dario Amodei 拒絕讓 Claude 被用於大規模監控美國公民，也拒絕讓它操控自主武器。這不是一般的商業糾紛。這是一家估值數百億美元的 AI 公司，因為堅持技術紅線而被自己國家的軍方封殺。兩條紅線Anthropic 和五角大廈的談判卡在兩個條款上：禁止大規模監控：Claude 不能被用來對美國公民進行未經授權的大規模數據蒐集和分析禁止自主武器：Claude 不能作為完全自主殺傷性武器的決策核心 Amodei 的立場很明確——這兩條不談。五角大廈的回應也很明確——那你就別做政府生意了。 2 月底，國防部正式將 Anthropic 列入「供應鏈風險」名單。這個標籤的殺傷力不只是失去國防合約，而是所有聯邦政府承包商在六個月內都必須停止使用 Claude。根據 Anthropic 的法庭文件，超過 100...

AI 比人類更會操作電腦了：GPT-5.4 Computer Use 技術拆解與開發者該注意的三件事

發表於2026-03-14|AI開發工具

3 月 5 日，OpenAI 發布 GPT-5.4。大多數人的注意力被 1M token context window 和 Tool Search 搶走了，但我認為真正該被討論的是另一件事：Computer Use。 GPT-5.4 在 OSWorld 基準測試拿到 75.0% 的成功率。人類專家是 72.4%。 AI 操作電腦的成功率，正式超過人類了。 OSWorld 75%，這個數字為什麼重要先說清楚 OSWorld 在測什麼。它不是問 AI「怎麼操作試算表」然後看回答正不正確。它是真的把 AI 丟到一台有作業系統的電腦前面，給它任務，看它能不能完成。任務長這樣：「找到最近修改過的試算表並打開它」「把 Wi-Fi 切換到辦公室網路」「打開 Chrome，到某個網站，把這份表單填完」都是你每天在做的事。而 GPT-5.4 做這些事的成功率，比被付錢來完美完成任務的人類測試員還高。模型 OSWorld 成功率與人類（72.4%）比較 GPT-5.4 75.0% +2.6% GPT-5.2 47.3% -25.1% 之前最佳...