kyosora 筆記

從 10 萬到 9700 萬下載：MCP 如何在 14 個月內變成 AI 工具連接的 USB

發表於2026-03-16|AI工具實戰工具與生產力

2024 年 11 月，Anthropic 發了一篇不起眼的公告，介紹一個叫 Model Context Protocol 的東西。SDK 月下載量大約 10 萬。 14 個月後的今天，MCP 月下載量 9,700 萬。970 倍。OpenAI、Google、Microsoft、AWS 全部原生支援。治理權捐給了 Linux Foundation 底下的 Agentic AI Foundation。 10 萬到 9,700 萬，一年多一點。我想聊聊這件事為什麼值得開發者認真看待。問題不是技術，是膠水2024 年底的 AI 開發長這樣：你的 LLM 需要讀 GitHub issue，你寫一個 function call。需要查 Slack 訊息，再寫一個。需要讀資料庫，再來一個。每個整合都是客製化的，每換一個 LLM 供應商就要重寫一遍。這跟 USB 出現之前的電腦周邊一模一樣。印表機用 parallel port，滑鼠用 serial port，鍵盤用 PS/2。每種裝置一種介面，每種介面一個驅動程式。 MCP 做的事情就是定義一個統一介面：LLM（client）透過標準化的...

NVIDIA 不只賣 GPU 了：從 200 億 Groq 收購到 NemoClaw，黃仁勳怎麼蓋出 AI 全棧帝國

發表於2026-03-16|AI工具實戰AI產業觀察

2026 年 3 月 16 日，NVIDIA GTC 大會在聖荷西 SAP Center 開幕。39,000 人從 190 個國家飛來，等著看黃仁勳穿皮夾克站上台講兩個小時。但今年的 GTC 跟往年不一樣。往年你聽到的是「我們的新 GPU 比上一代快幾倍」。今年的主軸是：NVIDIA 已經不是一家 GPU 公司了。 200 億美元買下 Groq，買的不是公司2025 年底，NVIDIA 花了 200 億美元跟 Groq 簽了一份「非排他性授權協議」。說是授權，實際上 Groq 的創辦人 Jonathan Ross（Google TPU 的設計者）和 80% 的工程團隊都跑去 NVIDIA 了。Groq 名義上還在，GroqCloud 繼續營運，但核心技術和人才已經搬家。 CNBC 分析師直接說：這筆交易的結構是「維持競爭存在的假象」。 NVIDIA 買的是 Groq 的 LPU（Language Processing Unit）技術。LPU 專為推理設計，不跑訓練。它的架構跟 GPU 完全不同——沒有外部記憶體存取的瓶頸，推理延遲極低。根據 GTC 前夕的報導，NVIDIA ...

你選的程式語言，其實是 AI 替你選的：GitHub 數據揭露的便利迴圈

發表於2026-03-16|AI工具實戰工具與生產力

2025 年 8 月，TypeScript 在 GitHub 上超越 Python 和 JavaScript，成為平台上最多人使用的程式語言。一年內新增超過一百萬名貢獻者，成長幅度 66%。這不是自然演化。這是 AI 在背後推了一把。 GitHub 的開發者倡導者 Andrea Griffiths 替這個現象取了一個名字：便利迴圈（Convenience Loop）。當 AI 讓某個技術用起來特別順手，開發者就會湧向它。湧入的開發者產出更多程式碼，這些程式碼成為 AI 的訓練資料，AI 對這個技術變得更強，吸引更多開發者。迴圈就這樣轉起來了。而且停不下來。 TypeScript 為什麼是最大贏家一個數字就能說明問題：2025 年一項學術研究發現，LLM 產出的編譯錯誤中，94% 是型別檢查失敗。想想這代表什麼。AI 寫的程式碼，十次編譯錯誤有九次以上是型別搞錯了。TypeScript 的型別系統就像一張安全網——你宣告了 x: string，AI 立刻知道該排除所有不適用於字串的操作。Python 的動態型別沒有這道防線，錯誤要到 runtime 才會爆開。對 AI 來說...

一家車廠要蓋全世界最大 AI 晶片廠：Tesla Terafab 背後的技術野心與開發者該注意的事

發表於2026-03-16|AI工具實戰AI產業觀察

3 月 14 日，Elon Musk 在 X 上發了一條短推：「Terafab Project launches in 7 days」。七天後的 3 月 21 日，Tesla 要正式啟動他們自己的晶片製造計畫。一家做電動車的公司，要蓋全世界最大的 AI 晶片廠。這不是 PPT 融資，是真的要量產 2 奈米製程晶片。我花了一些時間整理目前已知的技術細節，試著從開發者和 AI 從業者的角度，分析這件事為什麼值得關注。數字先擺出來Terafab 的規模用幾個數字就能理解：製程：2 奈米，目前商用最先進的節點月產能目標：10 萬片晶圓起步，遠期目標 100 萬片（TSMC 目前美國廠全部產能大約 14 萬片）年產量：1,000 億到 2,000 億顆 AI 和記憶體晶片估計成本：250 億美元第一顆晶片：AI5（Tesla 第五代 AI 晶片），2026 年小量試產，2027 年量產這些數字背後有一個簡單的邏輯。Musk 在 1 月的法說會上講得很直白：「即使用最樂觀的估計，供應商的產能還是不夠。」不夠用在哪？FSD 自駕軟體、Cybercab 無人計程車、Opt...

你的 AI 應用塞了 50 個工具？GPT-5.4 的 Tool Search 讓你省下一半 token

發表於2026-03-15|AI工具實戰前後端開發

上個月我在幫一個客服系統接 AI，工具列表長到我自己看了都頭痛——查訂單、退款、修改地址、查庫存、轉人工、寄信、查物流……加起來 47 個 function definition。每次 API 呼叫，光是把這些工具塞進 prompt 就吃掉 8,000 多個 token。使用者問一句「我的包裹到哪了」，模型還得先讀完退款政策和寄信格式才能回答。 GPT-5.4 在三月初發佈時帶來的 Tool Search 機制，直接解決了這個問題。問題的根源：你付錢讓模型讀它用不到的東西傳統的 function calling 很直觀——你把所有工具的 JSON schema 丟進 tools 陣列，模型看完後決定要呼叫哪個。問題是，模型不管用不用，都得讀。算一筆帳： 123一個工具定義 ≈ 150-300 tokens30 個工具 ≈ 4,500-9,000 tokens每次對話 10 輪 ≈ 45,000-90,000 tokens 花在重複讀工具定義這些 token 不產生任何價值。它們只是讓模型知道「我有這些能力」，但 90% 的對話只會用到 2-3 個工具。更糟的是，工具太多...

你的 AI 模型不需要永遠在思考：Phi-4-reasoning-vision 的思考開關機制拆解

發表於2026-03-15|AI工具實戰AI產業觀察

上週我在測一個圖片分類 pipeline，用的是某個 70B 的多模態模型。每張圖片丟進去，模型都要「深呼吸」想個十幾秒，輸出一大段 chain-of-thought，最後才吐出一個分類標籤。問題是，八成的圖片根本不需要推理。一張貓的照片，你不需要「讓我仔細分析這張圖片的像素分佈和語義特徵」，你只需要說「貓」。 Microsoft 在 3 月 4 日開源的 Phi-4-reasoning-vision-15B，做了一件我認為比「更大更強」更有價值的事：教模型判斷什麼時候該思考，什麼時候不該。 15B 參數做到了什麼先看數字。Phi-4-reasoning-vision-15B 在十個基準測試上的表現： AI2D（科學圖表）：84.8 ChartQA（圖表問答）：83.3 MathVista（數學視覺推理）：75.2 ScreenSpot v2（UI 元素定位）：88.2 MMMU（綜合多模態理解）：54.3 這些分數追不上 Qwen3-VL-32B，但跟同量級的 Qwen3-VL-8B 和 Kimi-VL-A3B 比，持平甚至領先。重點是，Qwen 家族的訓練資料量超過一兆...

AI Agent 框架大亂鬥：NemoClaw、OpenClaw 和開發者的真實選擇

發表於2026-03-15|AI工具實戰工具與生產力

老闆走過來說：「我看到競爭對手在用 AI Agent 自動處理客服了，我們也來做一個。」你心裡的 OS 大概是：用哪個框架？LangChain？AutoGen？還是最近爆紅的 OpenClaw？明天 NVIDIA GTC 又要發佈 NemoClaw，這局面到底怎麼選？我花了一整晚研究目前的 AI Agent 框架生態，把我的觀察整理成這篇。不賣焦慮，只講開發者真正需要思考的問題。數字先看：這不是 hype，但也不全是真的Gartner 和 Forrester 都把 2026 年標記為「多代理系統的突破年」。幾個關鍵數字： 57% 的企業已經有 AI Agent 在生產環境跑了（G2 調查） 40% 的企業應用預計會嵌入特定任務的 AI Agent 80% 的受訪者表示 AI Agent 已經產生可衡量的經濟影響全球 Agentic AI 市場規模從 2026 年的 91.4 億美元，預計 2034 年達到 1,390 億美元但 Gartner 同時預測：超過 40% 的 Agent 專案會在 2027 年前失敗。這個數字組合很有意思。多數企業在做，多數企業說有效，...

GTC 2026 前夕：Vera Rubin 架構與 NemoClaw 將如何改變 AI 開發者的日常

發表於2026-03-15|AI工具實戰AI產業觀察

明天（3/16）Jensen Huang 會站上 SAP Center 的舞台，開始一場兩小時的主題演講。GTC 2026 不只是 NVIDIA 的年度大拜拜——今年的發布內容，可能會直接改變我們未來兩年寫程式的方式。我花了幾天研究公開資料，整理出三個對開發者最有感的方向。 Vera Rubin：不只是「更快的 GPU」先說數字。Vera Rubin 架構的 GPU 擁有 3,360 億個電晶體，用台積電 3nm 製程，搭配 HBM4 記憶體。推理效能 50 PFLOPS（NVFP4），訓練 35 PFLOPS——分別是 Blackwell 的 5 倍和 3.5 倍。但真正讓我眼睛一亮的，是 NVL72 機架的規格：72 顆 Rubin GPU + 36 顆 Vera CPU，透過 NVLink 6 連接，每顆 GPU 有 3.6 TB/s 的雙向頻寬，整個機架的 scale-up 頻寬達到 260 TB/s。這意味著什麼？以前跑大型模型需要跨節點通訊，頻寬瓶頸讓 pipeline parallelism 變成必修課。260 TB/s 的 scale-up 頻寬把 72 ...

Anthropic 拒絕讓 AI 做武器，被美國政府列入黑名單：技術紅線背後的架構抉擇

發表於2026-03-15|AI工具實戰AI產業觀察

3 月 9 日，Anthropic 同時在加州北區聯邦法院和華盛頓特區上訴法院提起訴訟，控告美國國防部違法將其列為「供應鏈風險」。原因很單純：CEO Dario Amodei 拒絕讓 Claude 被用於大規模監控美國公民，也拒絕讓它操控自主武器。這不是一般的商業糾紛。這是一家估值數百億美元的 AI 公司，因為堅持技術紅線而被自己國家的軍方封殺。兩條紅線Anthropic 和五角大廈的談判卡在兩個條款上：禁止大規模監控：Claude 不能被用來對美國公民進行未經授權的大規模資料蒐集和分析禁止自主武器：Claude 不能作為完全自主殺傷性武器的決策核心 Amodei 的立場很明確——這兩條不談。五角大廈的回應也很明確——那你就別做政府生意了。 2 月底，國防部正式將 Anthropic 列入「供應鏈風險」名單。這個標籤的殺傷力不只是失去國防合約，而是所有聯邦政府承包商在六個月內都必須停止使用 Claude。根據 Anthropic 的法庭文件，超過 100 家企業客戶已經就此聯繫他們，可能影響「數億美元」營收。技術層面：紅線怎麼實作？這裡值得從工程角度思考一個問題：A...

AI 比人類更會操作電腦了：GPT-5.4 Computer Use 技術拆解與開發者該注意的三件事

發表於2026-03-14|AI工具實戰工具與生產力

3 月 5 日，OpenAI 發佈 GPT-5.4。大多數人的注意力被 1M token context window 和 Tool Search 搶走了，但我認為真正該被討論的是另一件事：Computer Use。 GPT-5.4 在 OSWorld 基準測試拿到 75.0% 的成功率。人類專家是 72.4%。 AI 操作電腦的成功率，正式超過人類了。 OSWorld 75%，這個數字為什麼重要先說清楚 OSWorld 在測什麼。它不是問 AI「怎麼操作試算表」然後看回答正不正確。它是真的把 AI 丟到一台有作業系統的電腦前面，給它任務，看它能不能完成。任務長這樣：「找到最近修改過的試算表並打開它」「把 Wi-Fi 切換到辦公室網路」「打開 Chrome，到某個網站，把這份表單填完」都是你每天在做的事。而 GPT-5.4 做這些事的成功率，比被付錢來完美完成任務的人類測試員還高。模型 OSWorld 成功率與人類（72.4%）比較 GPT-5.4 75.0% +2.6% GPT-5.2 47.3% -25.1% 之前最佳 AI ~60% -...