一個 GitHub 專案,沒有任何可執行程式碼,只有 61 個 Markdown 檔案,7 天內拿到 10,000 顆星。截至 3/14 已經衝到 39,300 星。
這不是什麼新框架或新語言。agency-agents 做的事情只有一件:用 Markdown 定義 AI 的專業人格。
聽起來荒謬,但它戳中了一個真實的問題。
你的 AI 助手什麼都會,所以什麼都做不好
用過 Claude Code 或 Cursor 的人都有這個經驗:你請 AI 寫一個 REST API,它給你一個「還行」的版本。能跑,但缺少認證考量、沒有速率限制、錯誤處理敷衍、命名風格前後不一。
問題不在模型能力。GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro——這些模型的知識量早就超過任何單一工程師。問題在於 context window 裡塞了太多可能性,模型不知道你要哪一種。
你問「幫我設計 API」,模型在 REST、GraphQL、gRPC 之間游移。你問「幫我寫測試」,模型不確定你要 unit test 還是 integration test,最後給你一個不痛不癢的折衷。
agency-agents 的解法直覺到令人意外:把模型的注意力鎖定在一個角色上。
一個 Markdown 檔怎麼定義一個「專家」
打開 agency-agents 的任何一個 agent 定義檔,結構大概長這樣:
1 | # Backend Architect |
沒有程式碼。沒有依賴。沒有 npm install。
但當你把這份檔案載入 Claude Code 作為 agent 定義,模型的行為會出現明顯變化。它不再給你「通用版本」的 API,而是直接帶上認證層、考慮速率限制、主動處理錯誤邊界。
原理很單純:system prompt 越具體,模型的輸出品質越高。這不是什麼新發現。但 agency-agents 把它工程化了。
9 個部門、112 個角色
agency-agents 用企業組織架構的方式分類 agent:
| 部門 | Agent 數量 | 範例角色 |
|---|---|---|
| Engineering | 25+ | Frontend Developer、Backend Architect、Security Engineer、SRE |
| Design | 8 | UI/UX Designer、Brand Guardian、Visual Storytelling |
| Marketing | 30+ | Growth Hacker、Content Strategist、Reddit Community Ninja |
| Testing | 8 | QA Engineer、Performance Tester、Accessibility Specialist |
| Sales | 8 | Outbound Specialist、Deal Strategist |
| Product | 4 | Sprint Planner、User Researcher |
| Project Management | 6 | Producer、Coordinator |
| Paid Media | 7 | PPC、Search、Programmatic |
| Support | 6 | Customer Service、Compliance |
有些角色名稱看起來很搞笑——Whimsy Injector(專門幫產品加入趣味性的 agent)、Reality Checker(專門潑冷水的 agent)。但這恰恰是重點:每個角色都有明確的職責邊界,而不是一個什麼都能做的通用 AI。
跨平台安裝:一份定義,多個 IDE
技術上最聰明的設計是跨平台相容性。同一份 agent 定義可以用在:
- Claude Code:直接放進
~/.claude/agents/目錄 - Cursor:轉換成
.mdcrule 檔案 - Aider:合併成
CONVENTIONS.md - Windsurf、Gemini CLI、OpenCode:各有對應的安裝腳本
1 | # 自動轉換並安裝到你的 IDE |
兩行指令。agent 定義是純 Markdown,轉換腳本負責適配各平台的格式差異。這代表團隊可以版本控制這些 agent 定義,像管理程式碼一樣管理 AI 行為。
多 Agent 協作:同時叫 8 個專家開會
單一 agent 就能提升品質,但真正的殺手功能是 multi-agent orchestration。
專案文件裡有一個叫「Nexus Spatial Discovery Exercise」的範例:同時啟動 8 個 agent——Backend Architect 負責 API 設計、Security Engineer 做威脅建模、QA Engineer 寫測試計畫、Frontend Developer 做 UI 原型——然後把各自的輸出彙整成一份完整的產品評估報告。
這跟傳統的 multi-agent framework(AutoGen、CrewAI、LangGraph)有本質差異。那些框架需要你寫 Python 程式碼來定義 agent 之間的通訊協議和工作流程。agency-agents 不需要——你的 IDE 就是 orchestrator。
在 Claude Code 裡,你可以用 Agent tool 同時啟動多個 subagent,每個載入不同的 persona markdown。不需要額外的框架、不需要 API key 管理、不需要佈署基礎設施。
為什麼純 Markdown 反而是優勢
初看之下「只有 Markdown 沒有程式碼」像是缺陷。但仔細想想,這其實是最佳設計決策:
1. 零依賴——不會因為某個 Python 套件版本衝突而壞掉。不需要 Docker。不需要 GPU。
2. 人類可讀——任何人都能打開一個 agent 定義檔,三分鐘內理解它做什麼、不做什麼。新人 onboarding 的成本趨近於零。
3. 可 diff、可 review——agent 行為的每一次修改都能在 git diff 裡看到。Code review agent 定義跟 review 程式碼一樣自然。
4. 可組合——你可以 fork 一個 agent、調整幾行描述、產生一個完全不同行為的變體。不需要理解任何框架的 API。
5. 模型無關——同一份定義可以餵給 Claude、GPT、Gemini、Llama。切換模型不需要改 agent 定義。
這讓我想到 Linus Torvalds 的觀點:好的抽象應該讓特殊情況消失。agency-agents 把「如何讓 AI 寫出更好的程式碼」這個複雜問題,簡化成「寫一份更好的 Markdown」。
跟 NemoClaw、OpenClaw 形成的生態位
同一週,AI agent 生態出現了三個層次:
- NVIDIA NemoClaw(3/16 GTC 發布):企業級 AI agent 平台,需要 GPU 叢集、Kubernetes、完整的 MLOps 管線。目標客戶是大公司。
- OpenClaw(210K 星):個人 AI 助手閘道器,連接 50+ 整合(WhatsApp、Telegram、Slack)。目標用戶是個人。
- agency-agents(39K 星):開發者工作流 agent,純 Markdown,零基礎設施。目標用戶是寫程式的人。
三個專案解決三個不同的問題,但指向同一個趨勢:AI 從「一個大模型回答所有問題」轉向「多個專業化角色各司其職」。
實際用起來的限制
我認為需要誠實說幾個限制:
context window 消耗——每載入一個 agent 定義,就吃掉一段 context。如果同時跑 8 個 agent,主 session 的可用 context 會被壓縮。在 Claude Code 裡,subagent 有獨立的 context window,問題比較小。但在 Cursor 裡,所有 rules 共享同一個 context。
品質參差不齊——112 個 agent 不可能每個都是精品。Engineering 類的 agent 定義明顯比 Marketing 類的更成熟,可能因為貢獻者大多是工程師。
不是萬能藥——如果你的問題是「模型本身能力不夠」,換一個 persona 不會讓它突然變強。persona 做的是聚焦,不是升級。
團隊協作成本——當團隊開始自訂 agent 定義,你需要一套 review 流程來確保品質。這本身就是一項管理工作。
你可以現在就做的三件事
1. 試一個 Engineering agent——不需要裝整個專案。到 GitHub 上複製 engineering-backend-architect.md 的內容,丟進你的 Claude Code agents 目錄或 Cursor rules,然後用它設計一個 API。跟你平常不帶 persona 的結果比較一下。
2. 寫你自己的 agent——根據你團隊的 coding standards,寫一份 200 行的 Markdown agent 定義。把你們的命名規範、錯誤處理方式、測試策略全部寫進去。這比任何 linter 都有效。
3. 版本控制 agent 定義——開一個 agents/ 目錄放進你的 repo。讓 agent 定義跟著程式碼一起演進。當有人改了 agent 的行為,PR review 自然會 catch 到。
Multi-agent 這條路才剛開始。但 agency-agents 證明了一件事:有時候最有效的工具,不是最複雜的框架,而是一份寫得夠好的文件。
