上週 Anthropic 和 Mozilla 聯合發了一篇公告:Claude Opus 4.6 在兩週內掃描了 Firefox 將近 6,000 個 C++ 檔案,提交 112 份報告,其中 22 個被確認為真實漏洞,14 個是高嚴重性。

這個數字什麼概念?2025 一整年 Firefox 修補的高嚴重性漏洞,大約是這次兩週產出的五倍。換句話說,Claude 兩週的產量接近 2025 全年的兩成。

我花了一些時間讀完 Anthropic 的技術報告和 Mozilla 的回應,想整理出幾個工程師會在意的重點。

它是怎麼掃的?

Anthropic 的團隊沒有直接丟整個 codebase 給 Claude 然後說「幫我找 bug」。他們分了兩個階段:

第一階段:驗證能力。 先拿 Firefox 舊版本中已知的 CVE,讓 Claude 看能不能重現。這步很關鍵——如果連已知漏洞都找不到,就沒必要往下走了。

第二階段:掃描未知漏洞。 從 JavaScript 引擎開始(這是瀏覽器最複雜、攻擊面最大的部分),逐步擴展到其他元件。兩週內掃了將近 6,000 個 C++ 檔案。

第一個漏洞在探索開始 20 分鐘後就被發現了——一個 JavaScript 引擎裡的 Use After Free 記憶體漏洞。這類漏洞允許攻擊者用惡意內容覆寫已釋放的記憶體區塊,嚴重的話可以執行任意程式碼。

一個研究員獨立驗證,另外兩個人再次確認,Claude 還生成了修補建議。

112 份報告,22 個真的

112 份報告裡只有 22 個被確認,代表誤報率大約 80%。這個數字看起來不太好看,但換個角度想:

  • 人類安全研究員的工具(fuzzer、靜態分析器)誤報率通常也在 70-90%
  • 重點是那 22 個真的漏洞的品質——14 個高嚴重性
  • Mozilla 的團隊表示他們「幫助 Anthropic 理解什麼樣的發現值得提交 bug report」,代表後期的報告品質在提升

Mozilla 對提交品質有三個要求:

  1. 能重現漏洞的最小測試案例
  2. 詳細的 Proof of Concept
  3. 候選修補程式

Claude 都做到了。不只是說「這裡有問題」,而是「這裡有問題,這樣可以重現,這是我建議的修法」。

找漏洞很行,寫 Exploit 不行

這是整篇報告最有趣的部分。

Anthropic 花了大約 4,000 美元的 API 費用,跑了幾百次迭代,試圖讓 Claude 把找到的漏洞寫成可運作的 exploit。

結果?只有 2 個成功,而且只在刻意移除現代瀏覽器安全功能(例如 sandbox)的測試環境裡才能用。

Anthropic 的結論是:

找到漏洞的成本,比把漏洞變成攻擊的成本低一個數量級。

翻成白話:Claude 是天生的防守方。它能高效率地找出問題,但要把問題武器化?目前的能力遠遠不夠。

這對安全生態來說其實是好消息。防守方用 AI 找漏洞的效益,遠大於攻擊方用 AI 寫 exploit 的效益。至少目前是這樣。

Task Verifier:讓 AI 能深入探索的關鍵

報告裡提到一個技術細節我覺得特別值得注意:task verifier

Anthropic 建了一套驗證工具,在 Claude 探索 codebase 的過程中提供即時回饋。這讓 Claude 可以持續迭代,直到它確認:

  1. 漏洞真的存在(不是誤判)
  2. 修補後程式功能正常(不會修一個壞另一個)

沒有這套 verifier,Claude 只是在猜。有了它,Claude 能進入「深度探索」模式——不斷嘗試、驗證、修正,直到找到真正的問題。

這個模式其實跟人類安全研究員的工作流程很像:先有假設,驗證,失敗了就調整假設,再驗證。差別是 Claude 跑一輪的速度是分鐘級,人類是小時級。

對開發者的實際意義

如果你在維護一個中大型專案,這件事值得關注:

短期(現在就能做):

  • AI 輔助的安全審計已經不是概念驗證了,Mozilla 和 Anthropic 已經證明它能在生產級 codebase 上運作
  • Firefox 148 已經修了大部分被發現的漏洞,代表從發現到修補的流程是成熟的

中期(半年到一年):

  • 預期會有更多 AI 安全掃描工具進入市場
  • 對 C/C++ 專案特別有價值,因為記憶體安全漏洞是這類語言的先天弱點
  • Rust 專案的安全掃描場景會不太一樣(邏輯錯誤 > 記憶體錯誤)

值得思考的:

  • 如果 AI 兩週能找到 22 個漏洞,那現在的 codebase 裡還有多少沒被發現的?
  • 安全研究員的角色會從「找漏洞的人」轉變為「驗證和排序 AI 報告的人」
  • 誰先用 AI 掃,誰就先修。攻擊者也能用同樣的技術找漏洞,但前面說了,exploit 化的難度高得多

數字整理

項目 數據
掃描時間 2 週(2026 年 2 月)
使用模型 Claude Opus 4.6
掃描檔案數 ~6,000 個 C++ 檔案
提交報告數 112 份
確認漏洞數 22 個
高嚴重性 14 個
中嚴重性 7 個
低嚴重性 1 個
Exploit 嘗試成本 ~$4,000 API 費用
Exploit 成功數 2 個(受限環境)
修補版本 Firefox 148.0

我的看法

這次合作最重要的不是「AI 找到了 22 個漏洞」這個標題,而是背後的不對稱性:

防守方的成本在降低,攻擊方的成本沒有等比例降低。

Claude 找一個漏洞可能花幾十美元的 API 費用,但要把同一個漏洞變成可用的攻擊,花了數千美元還只成功兩次。這個差距在未來只會更大,因為找漏洞是模式匹配問題(LLM 擅長的),而寫 exploit 需要對底層系統有精確理解和創造性繞過(LLM 目前的弱項)。

Mozilla 在這件事上的態度也值得學習。他們不是被動等 Anthropic 送報告,而是主動參與,幫助定義什麼算有效的 bug report,確保流程能在真實的開發節奏中運作。

如果你的公司有預算做安全審計,現在可能是把 AI 輔助掃描加入清單的時候了。不用取代人類安全專家,但讓 AI 先跑一輪,把低垂的果實摘掉,讓人類專家專注在更複雜的邏輯漏洞上。


參考來源:Anthropic Blog - Partnering with Mozilla to improve Firefox's securityTechCrunch 報導Mozilla Blog