Mythos 5 天攻破 Apple M5 內核：AI 不是主角，但漏洞研究的時間軸已經被改寫

5 月 14 日 Calif 安全團隊在自家部落格丟出一個炸彈：他們用 Anthropic 的 Mythos Preview，在 5 天內針對 Apple M5 macOS 內核做出了一條完整的 LPE（本地提權）exploit，繞過了 Apple 花 5 年、燒了不知道幾個億打造的 MIE 硬體記憶體安全機制。

接著媒體標題集體起飛：「AI 5 天破解 Apple 5 年防線」「AI 顛覆網路安全」。但你把 Calif 自己那篇技術揭露讀完會發現——這故事真正的重點不在那個 5 vs 5 的爽快對比，而在一個更安靜也更恐怖的事實。

5 天裡實際發生了什麼

照 Calif 官方公開的時間軸：

4/25：Bruce Dang 發現了 bugs
4/27：Dion Blazakis 加入 Calif
5/01：可用 exploit 完成
5/14：親自飛 Apple 總部當面交給對方，然後公開揭露

從 bug 被發現到可用 exploit，4/25 到 5/1，加起來 5 天。注意是「找到 bug 之後 5 天內做出 exploit」，不是「Mythos 從零開始 5 天破解 Apple」。

也別忽略名單。Bruce Dang 是業界知道的資深逆向工程師，寫過《Practical Reverse Engineering》；Dion Blazakis 是長期做 iOS / macOS 漏洞研究的老兵。這不是兩個剛出社會的工程師讓 Mythos 自己跑，是兩位業界頂尖的硬殼老手配上 AI 工具。差異很大。

攻擊本身講什麼（已揭露的部分）

Calif 的技術描述很節制，因為 Apple 還沒修，完整細節要等修補後才會公開。目前已知：

目標：macOS 26.4.1 (25E253)，bare-metal M5 硬體，kernel MIE 已啟用
攻擊型態：data-only kernel local privilege escalation chain
起點：unprivileged local user
終點：root shell
方法：兩個 vulnerability + 只用標準系統呼叫，完全不操作指標

最後那句「不操作指標、純資料攻擊」是這次 bypass 的關鍵。Apple 的 MIE 基於 ARM 的 MTE（Memory Tagging Extension）——每塊 16-byte 的記憶體切片帶 4-bit tag，指標也帶 tag，存取時硬體會檢查兩者是否相符。這套機制是針對透過破壞指標達成記憶體腐蝕的攻擊設計的。

但如果你的攻擊完全不動指標——只透過合法系統呼叫操弄資料結構，讓核心自己走到一個錯誤的狀態——MIE 整套設計就過去了。它不是防護「不正確的執行流」，它是防護「指標被改」。資料層的攻擊不在它的威脅模型裡。

這就是為什麼 Calif 的描述是 data-only。Apple 5 年防的是 A 類問題，攻擊者用了 B 類方法。MIE 沒有失敗，是它的威脅模型被繞過了。

Mythos 真正可怕的不是「快」

Calif 部落格裡有一句被很多人錯過的話：

Mythos Preview is powerful: once it has learned how to attack a class of problems, it generalizes to nearly any problem in that class.

翻譯過來：只要 Mythos 學會打一類問題，這類問題裡幾乎所有變體它都能打。

對攻擊者來說，這是降維打擊。傳統的漏洞研究有個天然瓶頸——研究員學會一類攻擊技術，要把這套技術應用到每個新目標都需要時間。AI 把這個複用速度抬到了完全不同的量級。同樣一個老手研究員，過去一年能完成 N 條 exploit chain，配上 Mythos 之後可能變 5N 或 10N。

防禦端有同樣的工具嗎？理論上有——Apple 內部也在用 AI 做安全研究。但攻守不對稱在這裡很明顯：攻擊只需要找到一個漏洞，防禦要堵住所有漏洞。AI 把「找一個」這件事的成本壓低，遠比把「堵所有」的成本壓低來得快。

這才是這次事件的真正訊息。不是 AI 5 天破了 Apple 5 年，是漏洞研究的單位時間產出曲線整條被往上推——而推上去的這條曲線，攻擊者那邊的斜率更陡。

不要把這件事讀成「AI 自己會駭」

媒體標題容易讓讀者腦補出一個畫面：你打開一個聊天視窗，輸入「幫我駭 Apple」，AI 就吐出 exploit。實際完全不是這樣。

從 Calif 公開的流程看，Mythos 的角色像是一個「極其耐操的高級助教」——它幫頂尖研究員加速辨識 bug class、生成 fuzzer、嘗試 exploit 路徑、跟著研究員的直覺迭代。沒有 Bruce Dang 那種等級的研究員看著它，它生不出可用的 exploit chain。Calif 那 5 天不是 AI 5 天，是「Bruce Dang + Dion Blazakis + Mythos」5 天。

把這件事讀成 AI 神話，會錯失它真正的工程啟示——AI 在「需要極強領域 expertise 才能上手的工作」裡，會放大頂尖人才的產出，但不會降低入門門檻。一個沒有漏洞研究經驗的人拿 Mythos 也駭不了 M5；一個 Bruce Dang 拿 Mythos 變成兩個 Bruce Dang。

軟體開發那邊我們已經在這個轉折點上：Claude Code、Codex 都讓資深工程師產出倍增，讓沒底子的人寫出表面像樣但細節崩潰的 code。安全研究現在進入同一條曲線。

為什麼他們親自飛 Apple 總部

Calif 部落格說明這個決策時用了一句很江湖的話：

我們想當面報告，免得被淹沒在提交洪流裡。也算是在永恆的 Twitter 五分鐘榮光競賽裡多搶一點 edge。

這段話表面是自嘲，底層是個產業訊號——Apple 的安全漏洞回報量正在爆炸。當 AI 工具讓漏洞研究的單位時間產出大漲，所有大公司的 security response team 都會被淹沒。提交一份高品質報告現在不一定能拿到 Apple 的注意力，因為他們的隊伍裡可能塞了一堆 AI 自動產生的低品質「疑似漏洞」。

這對任何維運大型平台的團隊都是新挑戰：你的漏洞分流系統能不能撐住 AI 時代的提交流量？ 過去靠人工讀 PoC 的流程要被重做。Calif 親自飛 Apple 是一個因應，但他們要解決的問題，所有維運大型平台的人遲早都要正面對上。

我從這條新聞帶走什麼

不寫安全研究，但寫日常用 Claude Code / Codex 寫 code 的工程師，這條新聞值得想三件事：

產出曲線的不對稱性適用到任何工作。寫 code 也好、做安全研究也好，AI 把「深度依賴 expertise 的工作」放大，把「沒有 expertise 就無法判斷品質的工作」拖下水。決定自己在哪一邊，比挑工具重要。
基礎設施類的 OWASP / 弱點掃描思路要升級。我們維運的系統大部分還在「人類能想到的攻擊向量」這個假設下設計。AI 會幫攻擊者生成更多 unconventional 路徑，data-only 那一類就是典型例子。靜態分析、fuzzing 工具該重新評估。
不要被「AI 自己會 X」這種敘事騙過去。Mythos 不是自己會駭，是 Bruce Dang 配上 Mythos 變成超人。對應到我自己工作上：Claude Code 也不是自己會寫 code，是我配上 Claude Code 變得更快。主詞是我，不是 AI。失去這個 framing，下一篇被打臉的論文遲早會落到自己頭上。

Apple 修補後 Calif 會公開完整技術細節，到時候 data-only attack 的具體手法應該值得單獨寫一篇。這篇先收在「不要被新聞標題騙了」這個層次。

參考資料