AI抓漏洞比人快？Claude兩週內在Firefox挖出22個安全漏洞的技術內幕

上週 Anthropic 和 Mozilla 聯合發了一篇公告：Claude Opus 4.6 在兩週內掃描了 Firefox 將近 6,000 個 C++ 檔案，提交 112 份報告，其中 22 個被確認為真實漏洞，14 個是高嚴重性。

這個數字什麼概念？2025 一整年 Firefox 修補的高嚴重性漏洞，大約是這次兩週產出的五倍。換句話說，Claude 兩週的產量接近 2025 全年的兩成。

我花了一些時間讀完 Anthropic 的技術報告和 Mozilla 的回應，想整理出幾個工程師會在意的重點。

它是怎麼掃的？

Anthropic 的團隊沒有直接丟整個 codebase 給 Claude 然後說「幫我找 bug」。他們分了兩個階段：

第一階段：驗證能力。 先拿 Firefox 舊版本中已知的 CVE，讓 Claude 看能不能重現。這步很關鍵——如果連已知漏洞都找不到，就沒必要往下走了。

第二階段：掃描未知漏洞。 從 JavaScript 引擎開始（這是瀏覽器最複雜、攻擊面最大的部分），逐步擴展到其他元件。兩週內掃了將近 6,000 個 C++ 檔案。

第一個漏洞在探索開始 20 分鐘後就被發現了——一個 JavaScript 引擎裡的 Use After Free 記憶體漏洞。這類漏洞允許攻擊者用惡意內容覆寫已釋放的記憶體區塊，嚴重的話可以執行任意程式碼。

一個研究員獨立驗證，另外兩個人再次確認，Claude 還生成了修補建議。

112 份報告裡只有 22 個被確認，代表誤報率大約 80%。這個數字看起來不太好看，但換個角度想：

Mozilla 對提交品質有三個要求：

Claude 都做到了——給的是帶重現步驟和修法建議的完整報告，不是「這裡有問題」這樣的泛泛說法。

這是整篇報告最有趣的部分。

Anthropic 花了大約 4,000 美元的 API 費用，跑了幾百次迭代，試圖讓 Claude 把找到的漏洞寫成可運作的 exploit。

結果？只有 2 個成功，而且只在刻意移除現代瀏覽器安全功能（例如 sandbox）的測試環境裡才能用。

Anthropic 的結論是：

找到漏洞的成本，比把漏洞變成攻擊的成本低一個數量級。

翻成白話：Claude 是天生的防守方。它能高效率地找出問題，但要把問題武器化？目前的能力遠遠不夠。

這對安全生態來說其實是好消息。防守方用 AI 找漏洞的效益，遠大於攻擊方用 AI 寫 exploit 的效益。至少目前是這樣。

報告裡提到一個技術細節我覺得特別值得注意：task verifier。

Anthropic 建了一套驗證工具，在 Claude 探索 codebase 的過程中提供即時回饋。這讓 Claude 可以持續迭代，直到它確認：

沒有這套 verifier，Claude 只是在猜。有了它，Claude 能進入「深度探索」模式——不斷嘗試、驗證、修正，直到找到真正的問題。

這個模式其實跟人類安全研究員的工作流程很像：先有假設，驗證，失敗了就調整假設，再驗證。差別是 Claude 跑一輪的速度是分鐘級，人類是小時級。

如果你在維護一個中大型專案，這件事值得關注：

短期（現在就能做）：

中期（半年到一年）：

值得思考的：