Chrome DevTools MCP vs Claude in Chrome:兩種 AI 瀏覽器自動化方案,你該選哪個?
GitHub 頁面:Chrome DevTools MCP瀏覽器自動化進入 MCP 時代我在 Claude Code 裡已經用了好幾個月的 Claude in Chrome,拿它來做網頁截圖、填表單、讀取頁面內容。直到最近看到 Google 官方推出了 Chrome DevTools MCP——由 Chrome DevTools 團隊維護,整合了 Puppeteer、效能追蹤、Lighthouse 審計等功能。 這就讓我好奇了:同樣都是讓 AI 控制瀏覽器的 MCP server,兩者的定位和能力差在哪裡? Chrome DevTools MCP:它是什麼Chrome DevTools MCP 是 Google 官方維護的 MCP server,透過 Chrome DevTools Protocol(CDP)讓 AI agent 控制和檢查 Chrome 瀏覽器。它不只是「能點按鈕、填表單」這種程度,而是把 Chrome DevTools 的完整除錯能力暴露給 AI。 核心特點: 效能追蹤:錄製 Performance trace,分析載入瓶頸,整合 CrUX...
61 個 Markdown 檔讓你的 IDE 變成 AI 公司:agency-agents 爆紅背後的技術邏輯
一個 GitHub 專案,沒有任何可執行程式碼,只有 61 個 Markdown 檔案,7 天內拿到 10,000 顆星。截至 3/14 已經衝到 39,300 星。 這不是什麼新框架或新語言。agency-agents 做的事情只有一件:用 Markdown 定義 AI 的專業人格。 聽起來荒謬,但它戳中了一個真實的問題。 你的 AI 助手什麼都會,所以什麼都做不好用過 Claude Code 或 Cursor 的人都有這個經驗:你請 AI 寫一個 REST API,它給你一個「還行」的版本。能跑,但缺少認證考量、沒有速率限制、錯誤處理敷衍、命名風格前後不一。 問題不在模型能力。GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro——這些模型的知識量早就超過任何單一工程師。問題在於 context window 裡塞了太多可能性,模型不知道你要哪一種。 你問「幫我設計 API」,模型在 REST、GraphQL、gRPC 之間游移。你問「幫我寫測試」,模型不確定你要 unit test 還是 integration...
用兩個 AI 建立自動化工作流:讓龍蝦當 PM,Claude Code 當工人
凌晨三點,你的電腦正在幫你分析美股、寫技術文章、整理筆記。早上七點,一份完整的晨報自動推送到你的 Notion。白天你在 Telegram 對一隻機器龍蝦說「幫我查一下 NVIDIA 最新財報」,它寫好任務單,另一個 AI 在背景默默把事情做完。 這不是科幻小說,這是我用 Claude Code 和 OpenClaw 搭出來的雙 AI 工作流。 為什麼要用兩個 AI?一個 AI 做所有事情聽起來很美好,但實際跑起來會撞到幾個牆: Claude Code(CC) 是命令列工具,擅長深度工作——寫程式碼、分析資料、產出長篇內容。但它沒有常駐能力,不能 24 小時掛在那裡等你的訊息。 OpenClaw(龍蝦) 是 Docker 容器裡的常駐 AI 閘道,可以接 Telegram、Discord、Slack。它 24 小時在線,隨時能回你訊息。但它的強項是溝通和協調,不是深度工作。 把兩者組合起來:龍蝦當 PM 負責接單和調度,CC 當工人負責執行,各做各擅長的事。 整體架構12345678910111213141516你(Telegram) │ ▼龍蝦(OpenClaw...
Xcode 終於讓 AI Agent 進場了:兩分鐘做出一個 App 的背後意味著什麼
二月底,Apple 悄悄推了 Xcode 26.3。沒有 Keynote,沒有 Craig Federighi 站在台上用動畫炫技。但這次更新可能是 Xcode 近五年來最重要的一個版本。 因為從這個版本開始,你可以在 Xcode 裡直接使用 AI coding agent。不是那種「自動補完下一行」的小聰明,而是整個 agent 接管你的專案:理解架構、搜文件、改多個檔案、跑 build、看 Preview、發現 UI 有問題還會自己修。 有人用它兩分鐘內做出一個完整的 Pomodoro 計時器 App——有設定頁面、提醒功能、能跑的 UI。 兩分鐘。 這不是 Copilot 的升級版先說清楚 agentic coding 跟傳統 AI 輔助寫 code 的差別。 GitHub Copilot 和早期的 AI 工具做的事情是「你寫一行,它猜下一行」。你是主角,AI 是配角。你的游標在哪裡,它就在那裡幫你。 Agentic coding 完全不同。你給 agent 一個目標——「幫我做一個 Pomodoro 計時器」——然後它自己拆解任務、決定要改哪些檔案、寫 code、跑...
你的 CLAUDE.md 寫太多了:7,308 次實驗證明 AI Agent 指令 2-3 條就好
上週我在整理自己的 CLAUDE.md 時,發現它已經膨脹到快 800 行。規則疊規則、範例套範例,像一本員工手冊。直覺告訴我這樣「比較完整」,但實際體感是——Claude Code 有時會忽略我寫在後半段的指令,偶爾還會把兩條規則搞混。 然後我讀到 SkillsBench 這篇論文,它用 7,308 條執行軌跡和 84 個任務做了一件事:測量「給 AI Agent 的操作指引(Skills)」到底給多少、寫多長才有效。 結論讓我重新打開編輯器,把那 800 行砍掉一半。 先講數字研究團隊在 Claude Code、Codex CLI、Gemini CLI 三個平台上,測試了七種模型配置。每個任務跑五次,用程式化斷言判定通過與否——不是讓另一個 LLM 當裁判,是寫死的測試。 整體結論:精心撰寫的 Skills 平均提升 16.2 個百分點。這個數字本身不意外,有指引當然比沒有好。 意外的是拆開來看的時候。 2-3 條指引是甜蜜點,4 條以上開始拖後腿 Skills 數量 有 Skills 無 Skills 差距 1...
Claude Code 每次開新對話都在「失憶」?這個工具讓它記住你說過的每件事
你有沒有過這種經驗: 花了半小時跟 Claude Code 說清楚你的專案架構,解釋為什麼這裡不用 ORM、那裡要用自定義的錯誤格式、這個 naming convention 有歷史原因不要改——然後隔天開新 session,一切歸零。 它不記得。你得再說一遍。 這不是 Claude 的問題,是 LLM 的根本限制:每個 session 都是一個全新的對話,沒有上一次的任何記憶。你在 CLAUDE.md 寫的東西只能覆蓋靜態規範,卻沒辦法保留「上週我們決定把 API 分層重構,目前做到一半」這種動態的工作狀態。 claude-mem 就是為了解決這件事而生的。 它在背後做了什麼安裝之後,claude-mem 會在 Claude Code 的整個生命週期裡掛上 5 個自動化 hook: SessionStart:新 session 開始,自動把過去相關記憶注入進來 UserPromptSubmit:你每次送出訊息,它都在旁邊記錄 PostToolUse:Claude 每次用工具之後,觀察結果被自動捕捉 Stop:Claude...
你還在每次重新教 Claude Code 你的開發習慣嗎?這個 51k Stars 的配置包幫你省掉這件事
每次開一個新專案,你是不是都得跟 Claude Code 說一遍一樣的事: 「我們用 TypeScript,記得寫型別。」「代碼審查要檢查 SQL Injection。」「commit 訊息要用 conventional commits 格式。」 說完這次,下次還得再說一遍。 everything-claude-code 要解決的就是這件事——讓 Claude Code 一次就記住你的整套開發規範,不用每個專案都重頭來過。 這個 repo 有 51k Stars、6.4k Forks,是一個 Anthropic Hackathon 冠軍用超過 10 個月的實際開發產品經驗打磨出來的配置集合。不是某人週末隨手整理的筆記,是真的拿去建產品跑過的。 這到底是什麼?簡單講:一個完整的 Claude Code 腦袋移植包。 它包含: 13 個專業 subagent,各自負責不同工作(規劃、TDD、代碼審查、安全掃描……) 48 個 workflow skill,從 Django 到 Go 到 React 都有對應的最佳實踐 32 個 slash...
你的 Claude Code 只用到了 20%?這份 25k Stars 的資源清單讓它變 5 倍強
剛開始用 Claude Code 的時候,我以為它就是個進階版的「對話框」——貼代碼進去,等它回答。 直到我看到 awesome-claude-code 這個 repo,才發現自己根本沒在用這個工具。 這份由社群維護的清單目前有 25k Stars、1.5k Forks,收錄了超過 200 個工具、工作流程、配置模板和自動化腳本。不是那種「整理一堆連結就叫 awesome」的水貨清單——每個項目都要求有實際可用的功能,不收實驗性的佔坑。 拆開來看,你會發現 Claude Code 早就進化成一個完整的開發生態系了。 大多數人都在手動做的事,這裡早有自動化方案先說最實際的:Hooks。 Claude Code 支援在特定事件觸發時執行自定義腳本——工具執行前後、Session 結束時都能掛載。清單裡有幾個直接可以用的: CCNotify:每次 Claude Code 完成任務就發桌面通知。你終於不用一直盯著終端機等它跑完了 Britfix:自動把美式英語拼法轉成英式(color → colour,analyze → analyse)。在有語言規範要求的專案裡省下大量...
每次都要輸入一串指令?用 PowerShell Function 把 Claude Code 變成一個字
你有沒有這種經驗:每次想用 Claude Code 搭配 Chrome 瀏覽器時,都要輸入一長串指令? 1claude --chrome --dangerously-skip-permissions 手指敲到懷疑人生,而且一旦打錯一個字,又要重來一次。 今天教你一招,把這串指令變成兩個字母:cc 問題:為什麼需要關心這個?如果你常用 Claude Code 的瀏覽器整合功能,你會發現: 參數太長:--chrome --dangerously-skip-permissions 根本記不住 容易打錯:dangerously 這種長單字很容易拼錯 效率低落:每次啟動都要浪費 10 秒打指令 更慘的是,如果你還要傳其他參數(比如指定模型或專案路徑),指令會變得更長: 1claude --chrome --dangerously-skip-permissions --model opus some-argument 這根本是在折磨自己。 解決方案:用 PowerShell Function 封裝指令PowerShell 的 Function...
Claude Code 跑一半就停?Ralph Wiggum 讓 AI 自主工作 3 個月不中斷
你有沒有遇過這種情況:Claude Code 跑到一半說「完成了」,結果測試根本沒過?或是修好一個 bug 後,卻發現另外三個地方壞掉? 更慘的是,每次都要手動檢查、手動下指令、再手動確認。一個簡單的「把所有測試跑通」任務,你可能要來回操作 10 次以上。 如果我告訴你,有個技術能讓 Claude Code 自己迭代、自己修 bug、自己跑測試,直到真的完成為止——甚至有人用它讓 AI 自主開發了整整 3 個月,做出一個完整的程式語言編譯器,你信嗎? 這就是 Ralph Wiggum。 問題:AI 的「一次性思維」困境症狀 1:虛假的「完成」Claude Code 很聰明,但它有個致命問題:它以為自己做完了,但其實沒有。 1234你:「幫我把這個 API 的測試覆蓋率提升到 80%」Claude:「好的,我已經新增了 5 個測試檔案」你:npm test結果:❌ 12 tests failed, coverage: 45% 問題在哪?Claude 寫完測試就認為任務結束,但它沒有真正驗證結果。 症狀 2:迭代開發的高成本真實的開發場景通常是: 寫代碼 跑測試 →...
