5 月 14 日 Calif 安全團隊在自家部落格丟出一個炸彈:他們用 Anthropic 的 Mythos Preview,在 5 天內針對 Apple M5 macOS 內核做出了一條完整的 LPE(本地提權)exploit,繞過了 Apple 花 5 年、燒了不知道幾個億打造的 MIE 硬體記憶體安全機制

接著媒體標題集體起飛:「AI 5 天破解 Apple 5 年防線」「AI 顛覆網路安全」。但你把 Calif 自己那篇技術揭露讀完會發現——這故事真正的重點不在那個 5 vs 5 的爽快對比,而在一個更安靜也更恐怖的事實。

5 天裡實際發生了什麼

照 Calif 官方公開的時間軸:

  • 4/25:Bruce Dang 發現了 bugs
  • 4/27:Dion Blazakis 加入 Calif
  • 5/01:可用 exploit 完成
  • 5/14:親自飛 Apple 總部當面交給對方,然後公開揭露

從 bug 被發現到可用 exploit,4/25 到 5/1,加起來 5 天。注意是「找到 bug 之後 5 天內做出 exploit」,不是「Mythos 從零開始 5 天破解 Apple」。

也別忽略名單。Bruce Dang 是業界知道的資深逆向工程師,寫過《Practical Reverse Engineering》;Dion Blazakis 是長期做 iOS / macOS 漏洞研究的老兵。這不是兩個剛出社會的工程師讓 Mythos 自己跑,是兩位業界頂尖的硬殼老手配上 AI 工具。差異很大。

攻擊本身講什麼(已揭露的部分)

Calif 的技術描述很節制,因為 Apple 還沒修,完整細節要等修補後才會公開。目前已知:

  • 目標:macOS 26.4.1 (25E253),bare-metal M5 硬體,kernel MIE 已啟用
  • 攻擊型態:data-only kernel local privilege escalation chain
  • 起點:unprivileged local user
  • 終點:root shell
  • 方法:兩個 vulnerability + 只用標準系統呼叫,完全不操作指標

最後那句「不操作指標、純資料攻擊」是這次 bypass 的關鍵。Apple 的 MIE 基於 ARM 的 MTE(Memory Tagging Extension)——每塊 16-byte 的記憶體切片帶 4-bit tag,指標也帶 tag,存取時硬體會檢查兩者是否相符。這套機制是針對透過破壞指標達成記憶體腐蝕的攻擊設計的。

但如果你的攻擊完全不動指標——只透過合法系統呼叫操弄資料結構,讓核心自己走到一個錯誤的狀態——MIE 整套設計就過去了。它不是防護「不正確的執行流」,它是防護「指標被改」。資料層的攻擊不在它的威脅模型裡。

這就是為什麼 Calif 的描述是 data-only。Apple 5 年防的是 A 類問題,攻擊者用了 B 類方法。MIE 沒有失敗,是它的威脅模型被繞過了。

Mythos 真正可怕的不是「快」

Calif 部落格裡有一句被很多人錯過的話:

Mythos Preview is powerful: once it has learned how to attack a class of problems, it generalizes to nearly any problem in that class.

翻譯過來:只要 Mythos 學會打一類問題,這類問題裡幾乎所有變體它都能打。

對攻擊者來說,這是降維打擊。傳統的漏洞研究有個天然瓶頸——研究員學會一類攻擊技術,要把這套技術應用到每個新目標都需要時間。AI 把這個複用速度抬到了完全不同的量級。同樣一個老手研究員,過去一年能完成 N 條 exploit chain,配上 Mythos 之後可能變 5N 或 10N。

防禦端有同樣的工具嗎?理論上有——Apple 內部也在用 AI 做安全研究。但攻守不對稱在這裡很明顯:攻擊只需要找到一個漏洞,防禦要堵住所有漏洞。AI 把「找一個」這件事的成本壓低,遠比把「堵所有」的成本壓低來得快。

這才是這次事件的真正訊息。不是 AI 5 天破了 Apple 5 年,是漏洞研究的單位時間產出曲線整條被往上推——而推上去的這條曲線,攻擊者那邊的斜率更陡。

不要把這件事讀成「AI 自己會駭」

媒體標題容易讓讀者腦補出一個畫面:你打開一個聊天視窗,輸入「幫我駭 Apple」,AI 就吐出 exploit。實際完全不是這樣。

從 Calif 公開的流程看,Mythos 的角色像是一個「極其耐操的高級助教」——它幫頂尖研究員加速辨識 bug class、生成 fuzzer、嘗試 exploit 路徑、跟著研究員的直覺迭代。沒有 Bruce Dang 那種等級的研究員看著它,它生不出可用的 exploit chain。Calif 那 5 天不是 AI 5 天,是「Bruce Dang + Dion Blazakis + Mythos」5 天。

把這件事讀成 AI 神話,會錯失它真正的工程啟示——AI 在「需要極強領域 expertise 才能上手的工作」裡,會放大頂尖人才的產出,但不會降低入門門檻。一個沒有漏洞研究經驗的人拿 Mythos 也駭不了 M5;一個 Bruce Dang 拿 Mythos 變成兩個 Bruce Dang。

軟體開發那邊我們已經在這個轉折點上:Claude Code、Codex 都讓資深工程師產出倍增,讓沒底子的人寫出表面像樣但細節崩潰的 code。安全研究現在進入同一條曲線。

為什麼他們親自飛 Apple 總部

Calif 部落格說明這個決策時用了一句很江湖的話:

我們想當面報告,免得被淹沒在提交洪流裡。也算是在永恆的 Twitter 五分鐘榮光競賽裡多搶一點 edge。

這段話表面是自嘲,底層是個產業訊號——Apple 的安全漏洞回報量正在爆炸。當 AI 工具讓漏洞研究的單位時間產出大漲,所有大公司的 security response team 都會被淹沒。提交一份高品質報告現在不一定能拿到 Apple 的注意力,因為他們的隊伍裡可能塞了一堆 AI 自動產生的低品質「疑似漏洞」。

這對任何維運大型平台的團隊都是新挑戰:你的漏洞分流系統能不能撐住 AI 時代的提交流量? 過去靠人工讀 PoC 的流程要被重做。Calif 親自飛 Apple 是個人選擇,但它揭露的問題是系統性的。

我從這條新聞帶走什麼

不寫安全研究,但寫日常用 Claude Code / Codex 寫 code 的工程師,這條新聞值得想三件事:

  1. 產出曲線的不對稱性適用到任何工作。寫 code 也好、做安全研究也好,AI 把「深度依賴 expertise 的工作」放大,把「沒有 expertise 就無法判斷品質的工作」拖下水。決定自己在哪一邊,比挑工具重要。

  2. 基礎設施類的 OWASP / 弱點掃描思路要升級。我們維運的系統大部分還在「人類能想到的攻擊向量」這個假設下設計。AI 會幫攻擊者生成更多 unconventional 路徑,data-only 那一類就是典型例子。靜態分析、fuzzing 工具該重新評估。

  3. 不要被「AI 自己會 X」這種敘事騙過去。Mythos 不是自己會駭,是 Bruce Dang 配上 Mythos 變成超人。對應到我自己工作上:Claude Code 也不是自己會寫 code,是我配上 Claude Code 變得更快。主詞是我,不是 AI。失去這個 framing,下一篇被打臉的論文遲早會落到自己頭上。

Apple 修補後 Calif 會公開完整技術細節,到時候 data-only attack 的具體手法應該值得單獨寫一篇。這篇先收在「不要被新聞標題騙了」這個層次。


參考資料