上週 Anthropic 和 Mozilla 聯合發了一篇公告:Claude Opus 4.6 在兩週內掃描了 Firefox 將近 6,000 個 C++ 檔案,提交 112 份報告,其中 22 個被確認為真實漏洞,14 個是高嚴重性。
這個數字什麼概念?2025 一整年 Firefox 修補的高嚴重性漏洞,大約是這次兩週產出的五倍。換句話說,Claude 兩週的產量接近 2025 全年的兩成。
我花了一些時間讀完 Anthropic 的技術報告和 Mozilla 的回應,想整理出幾個工程師會在意的重點。
它是怎麼掃的?
Anthropic 的團隊沒有直接丟整個 codebase 給 Claude 然後說「幫我找 bug」。他們分了兩個階段:
第一階段:驗證能力。 先拿 Firefox 舊版本中已知的 CVE,讓 Claude 看能不能重現。這步很關鍵——如果連已知漏洞都找不到,就沒必要往下走了。
第二階段:掃描未知漏洞。 從 JavaScript 引擎開始(這是瀏覽器最複雜、攻擊面最大的部分),逐步擴展到其他元件。兩週內掃了將近 6,000 個 C++ 檔案。
第一個漏洞在探索開始 20 分鐘後就被發現了——一個 JavaScript 引擎裡的 Use After Free 記憶體漏洞。這類漏洞允許攻擊者用惡意內容覆寫已釋放的記憶體區塊,嚴重的話可以執行任意程式碼。
一個研究員獨立驗證,另外兩個人再次確認,Claude 還生成了修補建議。
112 份報告,22 個真的
112 份報告裡只有 22 個被確認,代表誤報率大約 80%。這個數字看起來不太好看,但換個角度想:
- 人類安全研究員的工具(fuzzer、靜態分析器)誤報率通常也在 70-90%
- 重點是那 22 個真的漏洞的品質——14 個高嚴重性
- Mozilla 的團隊表示他們「幫助 Anthropic 理解什麼樣的發現值得提交 bug report」,代表後期的報告品質在提升
Mozilla 對提交品質有三個要求:
- 能重現漏洞的最小測試案例
- 詳細的 Proof of Concept
- 候選修補程式
Claude 都做到了。不只是說「這裡有問題」,而是「這裡有問題,這樣可以重現,這是我建議的修法」。
找漏洞很行,寫 Exploit 不行
這是整篇報告最有趣的部分。
Anthropic 花了大約 4,000 美元的 API 費用,跑了幾百次迭代,試圖讓 Claude 把找到的漏洞寫成可運作的 exploit。
結果?只有 2 個成功,而且只在刻意移除現代瀏覽器安全功能(例如 sandbox)的測試環境裡才能用。
Anthropic 的結論是:
找到漏洞的成本,比把漏洞變成攻擊的成本低一個數量級。
翻成白話:Claude 是天生的防守方。它能高效率地找出問題,但要把問題武器化?目前的能力遠遠不夠。
這對安全生態來說其實是好消息。防守方用 AI 找漏洞的效益,遠大於攻擊方用 AI 寫 exploit 的效益。至少目前是這樣。
Task Verifier:讓 AI 能深入探索的關鍵
報告裡提到一個技術細節我覺得特別值得注意:task verifier。
Anthropic 建了一套驗證工具,在 Claude 探索 codebase 的過程中提供即時回饋。這讓 Claude 可以持續迭代,直到它確認:
- 漏洞真的存在(不是誤判)
- 修補後程式功能正常(不會修一個壞另一個)
沒有這套 verifier,Claude 只是在猜。有了它,Claude 能進入「深度探索」模式——不斷嘗試、驗證、修正,直到找到真正的問題。
這個模式其實跟人類安全研究員的工作流程很像:先有假設,驗證,失敗了就調整假設,再驗證。差別是 Claude 跑一輪的速度是分鐘級,人類是小時級。
對開發者的實際意義
如果你在維護一個中大型專案,這件事值得關注:
短期(現在就能做):
- AI 輔助的安全審計已經不是概念驗證了,Mozilla 和 Anthropic 已經證明它能在生產級 codebase 上運作
- Firefox 148 已經修了大部分被發現的漏洞,代表從發現到修補的流程是成熟的
中期(半年到一年):
- 預期會有更多 AI 安全掃描工具進入市場
- 對 C/C++ 專案特別有價值,因為記憶體安全漏洞是這類語言的先天弱點
- Rust 專案的安全掃描場景會不太一樣(邏輯錯誤 > 記憶體錯誤)
值得思考的:
- 如果 AI 兩週能找到 22 個漏洞,那現在的 codebase 裡還有多少沒被發現的?
- 安全研究員的角色會從「找漏洞的人」轉變為「驗證和排序 AI 報告的人」
- 誰先用 AI 掃,誰就先修。攻擊者也能用同樣的技術找漏洞,但前面說了,exploit 化的難度高得多
數字整理
| 項目 | 數據 |
|---|---|
| 掃描時間 | 2 週(2026 年 2 月) |
| 使用模型 | Claude Opus 4.6 |
| 掃描檔案數 | ~6,000 個 C++ 檔案 |
| 提交報告數 | 112 份 |
| 確認漏洞數 | 22 個 |
| 高嚴重性 | 14 個 |
| 中嚴重性 | 7 個 |
| 低嚴重性 | 1 個 |
| Exploit 嘗試成本 | ~$4,000 API 費用 |
| Exploit 成功數 | 2 個(受限環境) |
| 修補版本 | Firefox 148.0 |
我的看法
這次合作最重要的不是「AI 找到了 22 個漏洞」這個標題,而是背後的不對稱性:
防守方的成本在降低,攻擊方的成本沒有等比例降低。
Claude 找一個漏洞可能花幾十美元的 API 費用,但要把同一個漏洞變成可用的攻擊,花了數千美元還只成功兩次。這個差距在未來只會更大,因為找漏洞是模式匹配問題(LLM 擅長的),而寫 exploit 需要對底層系統有精確理解和創造性繞過(LLM 目前的弱項)。
Mozilla 在這件事上的態度也值得學習。他們不是被動等 Anthropic 送報告,而是主動參與,幫助定義什麼算有效的 bug report,確保流程能在真實的開發節奏中運作。
如果你的公司有預算做安全審計,現在可能是把 AI 輔助掃描加入清單的時候了。不用取代人類安全專家,但讓 AI 先跑一輪,把低垂的果實摘掉,讓人類專家專注在更複雜的邏輯漏洞上。
參考來源:Anthropic Blog - Partnering with Mozilla to improve Firefox's security、TechCrunch 報導、Mozilla Blog
