你的 AI Agent 拿到的權限比你的實習生還大?Anthropic 零信任框架拆解
5 月 27 日 Anthropic 丟出一份 36 頁的電子書,標題叫《Zero Trust for AI Agents》。這不是一般的行銷白皮書——它給了具體的架構、實施路徑和威脅分類,而且每條建議都對應到成熟度等級,讓你知道自己該做到哪一層。 我把重點整理出來,順便加上我自己在用 Claude Code 和各種 Agent 工具時踩過的坑。 為什麼現在要談 Agent 安全先說結論:AI Agent 跟傳統軟體最大的差別,是它會自己做決定。 傳統軟體執行你寫好的邏輯。Agent 不一樣,它解讀目標、選擇工具、執行多步驟操作,全程不需要你點頭。這帶來一個根本性的安全問題——你給它的權限,它會用自己的判斷去使用。 Anthropic 在文件裡點出了五個 Agent 特有的安全考量: 自主執行:不用人工批准就能完成整條工作流程 工具存取:能操作 API、資料庫、檔案系統、MCP 伺服器 決策模糊性:人類覺得無害的指令,Agent 可能解讀出完全不同的結果 跨 session 記憶:記住上次對話的偏好和知識——也記住被注入的毒 多 Agent 協作:Agent 之間的信任關係,讓...




