kyosora 筆記

微軟內部 Claude Code 被停用——同週 GitHub 備忘錄寫下「生存級風險」

發表於2026-05-21|工具與生產力AI產業觀察

2026 年 5 月 19 日那一週，微軟做了兩件看起來無關、其實是同一件事的事。第一件：The Information 報導微軟 Experiences + Devices 事業群取消大部分內部 Claude Code 授權，要求工程師在 2026 年 6 月 30 日前全面遷移到 GitHub Copilot CLI。第二件：同一週外流的內部備忘錄警告 GitHub 面臨「生存級風險」，因為 Cursor、Anthropic 的 Claude Code、OpenAI 等自主編程工具「削弱了把程式碼持續上傳到 GitHub 倉庫的必要性」。兩件事被各家媒體分開報導，但拼起來才看得到全貌。我認為這不是兩個故事，是同一個故事的因和果。六個月內從試用到強制下線先把時間線釘好： 2025 年 12 月：微軟開始邀請「數千名」內部開發者試用 Claude Code 2026 年 1 月：試用擴展至 Experiences + Devices 事業群全體，涵蓋 Windows、Microsoft 365、Outlook、Teams、Surface 工程團隊 2026 年 1 月起：...

你的 AI 模型不需要永遠在思考：Phi-4-reasoning-vision 的思考開關機制拆解

發表於2026-03-15|AI工具實戰AI產業觀察

上週我在測一個圖片分類 pipeline，用的是某個 70B 的多模態模型。每張圖片丟進去，模型都要「深呼吸」想個十幾秒，輸出一大段 chain-of-thought，最後才吐出一個分類標籤。問題是，八成的圖片根本不需要推理。一張貓的照片，你不需要「讓我仔細分析這張圖片的像素分佈和語義特徵」，你只需要說「貓」。 Microsoft 在 3 月 4 日開源的 Phi-4-reasoning-vision-15B，做了一件我認為比「更大更強」更有價值的事：教模型判斷什麼時候該思考，什麼時候不該。 15B 參數做到了什麼先看數字。Phi-4-reasoning-vision-15B 在十個基準測試上的表現： AI2D（科學圖表）：84.8 ChartQA（圖表問答）：83.3 MathVista（數學視覺推理）：75.2 ScreenSpot v2（UI 元素定位）：88.2 MMMU（綜合多模態理解）：54.3 這些分數追不上 Qwen3-VL-32B，但跟同量級的 Qwen3-VL-8B 和 Kimi-VL-A3B 比，持平甚至領先。重點是，Qwen 家族的訓練資料量超過一兆...