微軟內部 Claude Code 被停用——同週 GitHub 備忘錄寫下「生存級風險」
2026 年 5 月 19 日那一週,微軟做了兩件看起來無關、其實是同一件事的事。 第一件:The Information 報導微軟 Experiences + Devices 事業群取消大部分內部 Claude Code 授權,要求工程師在 2026 年 6 月 30 日前全面遷移到 GitHub Copilot CLI。第二件:同一週外流的內部備忘錄警告 GitHub 面臨「生存級風險」,因為 Cursor、Anthropic 的 Claude Code、OpenAI 等自主編程工具「削弱了把程式碼持續上傳到 GitHub 倉庫的必要性」。 兩件事被各家媒體分開報導,但拼起來才看得到全貌。我認為這不是兩個故事,是同一個故事的因和果。 六個月內從試用到強制下線先把時間線釘好: 2025 年 12 月:微軟開始邀請「數千名」內部開發者試用 Claude Code 2026 年 1 月:試用擴展至 Experiences + Devices 事業群全體,涵蓋 Windows、Microsoft 365、Outlook、Teams、Surface 工程團隊 2026 年 1...
你的 AI 模型不需要永遠在思考:Phi-4-reasoning-vision 的思考開關機制拆解
上週我在測一個圖片分類 pipeline,用的是某個 70B 的多模態模型。每張圖片丟進去,模型都要「深呼吸」想個十幾秒,輸出一大段 chain-of-thought,最後才吐出一個分類標籤。 問題是,八成的圖片根本不需要推理。一張貓的照片,你不需要「讓我仔細分析這張圖片的像素分佈和語義特徵」,你只需要說「貓」。 Microsoft 在 3 月 4 日開源的 Phi-4-reasoning-vision-15B,做了一件我認為比「更大更強」更有價值的事:教模型判斷什麼時候該思考,什麼時候不該。 15B 參數做到了什麼先看數字。Phi-4-reasoning-vision-15B 在十個基準測試上的表現: AI2D(科學圖表):84.8 ChartQA(圖表問答):83.3 MathVista(數學視覺推理):75.2 ScreenSpot v2(UI 元素定位):88.2 MMMU(綜合多模態理解):54.3 這些分數追不上 Qwen3-VL-32B,但跟同量級的 Qwen3-VL-8B 和 Kimi-VL-A3B 比,持平甚至領先。重點是,Qwen...
