kyosora 筆記

你的 AI Agent 拿到的權限比你的實習生還大？Anthropic 零信任框架拆解

發表於2026-05-28|AI工具實戰資訊安全

5 月 27 日 Anthropic 丟出一份 36 頁的電子書，標題叫《Zero Trust for AI Agents》。這不是一般的行銷白皮書——它給了具體的架構、實施路徑和威脅分類，而且每條建議都對應到成熟度等級，讓你知道自己該做到哪一層。我把重點整理出來，順便加上我自己在用 Claude Code 和各種 Agent 工具時踩過的坑。為什麼現在要談 Agent 安全先說結論：AI Agent 跟傳統軟體最大的差別，是它會自己做決定。傳統軟體執行你寫好的邏輯。Agent 不一樣，它解讀目標、選擇工具、執行多步驟操作，全程不需要你點頭。這帶來一個根本性的安全問題——你給它的權限，它會用自己的判斷去使用。 Anthropic 在文件裡點出了五個 Agent 特有的安全考量：自主執行：不用人工批准就能完成整條工作流程工具存取：能操作 API、資料庫、檔案系統、MCP 伺服器決策模糊性：人類覺得無害的指令，Agent 可能解讀出完全不同的結果跨 session 記憶：記住上次對話的偏好和知識——也記住被注入的毒多 Agent 協作：Agent 之間的信任關係，讓...