kyosora 筆記

Mythos 5 天攻破 Apple M5 內核：AI 不是主角，但漏洞研究的時間軸已經被改寫

發表於2026-05-18|AI安全研究

5 月 14 日 Calif 安全團隊在自家部落格丟出一個炸彈：他們用 Anthropic 的 Mythos Preview，在 5 天內針對 Apple M5 macOS 內核做出了一條完整的 LPE（本地提權）exploit，繞過了 Apple 花 5 年、燒了不知道幾個億打造的 MIE 硬體記憶體安全機制。接著媒體標題集體起飛：「AI 5 天破解 Apple 5 年防線」「AI 顛覆網路安全」。但你把 Calif 自己那篇技術揭露讀完會發現——這故事真正的重點不在那個 5 vs 5 的爽快對比，而在一個更安靜也更恐怖的事實。 5 天裡實際發生了什麼照 Calif 官方公開的時間軸： 4/25：Bruce Dang 發現了 bugs 4/27：Dion Blazakis 加入 Calif 5/01：可用 exploit 完成 5/14：親自飛 Apple 總部當面交給對方，然後公開揭露從 bug 被發現到可用 exploit，4/25 到 5/1，加起來 5 天。注意是「找到 bug 之後 5 天內做出 exploit」，不是「Mythos 從零開始 5 天破解...

LLM 不是不知道該用工具——它在最後一層轉了 90 度，叫不出來

發表於2026-05-18|AI論文解讀

用 Claude Code 久了會發現一種奇怪的 bug：你明確說「先 grep 一下這個 symbol」，它「嗯」一聲，然後直接憑記憶生出一個答案，工具呢？沒叫。又有時候你叫它「直接回答就好不用查」，它反而非要 Bash 一下。我以前的解釋很俗——prompt 不夠用力、tool description 不夠精準、模型太懶。最近 Maryland 大學的論文〈Model-Adaptive Tool Necessity Reveals the Knowing-Doing Gap in LLM Tool Use〉（arXiv:2605.14038）讓我換了一個視角。模型不是不知道該叫工具——它知道，但在輸出層轉了 90 度。兩階段分解：認知 vs 執行論文做了一件方法論層面很值得記住的事——把「LLM 使用工具」這個動作切成兩階段： Cognition（認知）：模型內部是不是相信「這題需要工具」。透過線性 probe 探測 hidden state 的方向，可以直接讀出模型的內部判斷。 Execution（執行）：模型實際輸出的 token 是不是 trigger 了...

AI Agent 越記越笨：一篇 Illinois 論文打臉所有「個人 AI 記憶」熱潮

發表於2026-05-18|AI論文解讀

幾個月前我停用了 claude-mem，理由很單純：MCP 每次互動都打一次 round-trip，對話被它拖到肉眼可見的慢。當時的決定純屬效能直覺，跟「記憶品質」沒關係——我預設「記得多總是好事」。上週 X 上開始刷一篇 UIUC 的 Dylan Zhang 等人的論文〈Useful Memories Become Faulty When Continuously Updated by LLMs〉（arXiv:2605.12978）。論文做了一個我看到結果愣了五秒的實驗：把 GPT-5.4 原本 100% 解得出來的 ARC-AGI 問題，丟進「持續記憶」的迴圈讓它一邊解一邊累積經驗——最後 54% 的題目反而解不出來了（注意：54% 是失敗率，不是剩餘準確率，原本 100% 變成只剩 46% 能解）。那一刻我反應過來，當初停用 claude-mem 那個直覺，可能比我想的還更對。論文在做什麼論文針對的是一個被很多主動寫入式記憶工具共用的設計誘惑——consolidation loop，三句話： 12345distill experience ...

黃仁勳叫 CS 畢業生去當電工——一週內三位 AI 老闆都在預告同一件事

發表於2026-05-18|AI觀點

上週五，黃仁勳在卡內基梅隆大學的畢業典禮上對 2026 屆資工系畢業生說了句話：電工和水管工比你們有前景。他不是在開玩笑。兩天後微軟 AI 部門的 CEO Mustafa Suleyman 接受 Fortune 採訪，預測 18 個月內 AI 會自動化掉所有「坐在電腦前」的白領工作。同一天 Anthropic CEO Dario Amodei 在華爾街日報的 YouTube 頻道說，軟體成本會崩到接近零，數十年累積的職業結構會跟著消失。一週之內三位 AI 圈最有話語權的人放話，方向高度一致。我們得認真看看他們在說什麼——以及我們自己該怎麼辦。一週內的三個訊號5/15，黃仁勳 @ CMU：給資工系畢業生的演講，主軸是「不要假設你選了一個鐵飯碗」。他引用的數據夠扎實： Randstad 分析顯示，技工的需求增長是白領職位的 3 倍機器人技術員職位增長 107% 斯坦福研究指出，AI 相關崗位的早期職業就業率下降 16% 頂級電工年薪可以超過 10.6 萬美元，而且不用揹學貸科技公司今年砸了 7000 億美元蓋資料中心，到 2030 年全球估計 7...

Anthropic 自己出手冊警告：AI 不是降低創業失敗率，是放大它

發表於2026-05-18|AI觀點

五月十四日 Anthropic 在自家部落格放出一份叫 Founder's Playbook 的內部手冊，主題是「怎麼用 AI 從零做一家 startup」。結論反直覺：AI 會放大你的創業失敗模式，而不是降低失敗率。寫這份手冊的是 Anthropic 自己——賣你 Claude Code 的那家公司——提醒你它賣的工具會放大失敗。我下載 PDF 那天剛好在抓一個 bug那天我在改公司專案的下載功能。PM 一直堅持是「SQL 抓不到資料」，花了快兩小時才發現根本不是——伺服器上的 LibreOffice 被 MODA ODF Application Tools 的安裝程式覆寫掉了，舊路徑變成空殼資料夾。問題本身只是一行硬編碼路徑。難搞的是錯誤被四層補丁吞掉的方式：執行檔不見就拋例外、ConvertFile 沒產出檔還是寫 log 繼續跑、controller 對著不存在路徑 return File()、最外層 catch 把一切包成 Content("查無資料")。前端拿到 1,229 bytes 的「ODS 檔」（其實是 HTML...

跟 AI 說「這對我很重要」讓它表現提升 115%——論文怎麼解釋這件事

發表於2026-05-06|AI論文閱讀

那個 115% 是怎麼來的我第一次看到這個數字的時候反應是「不可能吧」。論文叫 Large Language Models Understand and Can be Enhanced by Emotional Stimuli，2023 年由 Microsoft、中科院、威廉與瑪麗學院等機構合作發表。研究方法很簡單：在 prompt 末尾加上一句情緒話語，例如「這對我的職涯非常重要」「我相信你可以做得很好」，然後看模型表現會不會變化。結果是：自動評測涵蓋 45 個任務（Instruction Induction + BIG-Bench），多個模型上都看到改善另有 106 位受試者評估 30 個生成問題，EmotionPrompt 在 performance、truthfulness、responsibility 三項平均相對提升 10.9% 在 BIG-Bench 某些子任務上，相對改善飆到 115%（注意這是 relative improvement，在原始低基準任務上會被放大）在 Flan-T5、Vicuna、Llama...

你的 CLAUDE.md 超過 300 行了嗎？我用分層架構解決了三個問題

發表於2026-04-02|AIClaude Code

我的 CLAUDE.md 曾經有 800 多行。裡面塞了程式碼規範、交易哲學、小說寫作標準、TRPG 跑團引擎、150 個 skill 綁定，全部標「必須使用」。結果就是：AI 每次回應都在評估一百多條規則，該觸發的 skill 常常漏掉，不該觸發的反而亂觸發。寫程式的時候它想跟我討論交易策略，跑團的時候它想幫我做程式碼審查。花了幾週迭代，最後整理成一套架構，解決了三個具體問題。今天把它開源了：claude-layers。問題一：150 個 Skill 全標「必須使用」裝了三四十個 skill 之後，CLAUDE.md 裡的綁定表越來越長。每一條都寫「看到這個關鍵字，必須觸發這個 skill」。聽起來很合理，直到你發現 AI 把「必須」當成「全部一樣重要」。實際狀況是：有些 skill 包裝了外部 API（像 Twitter 發推用的 xurl、Google Workspace 用的 gog），不觸發就真的做不了事。但有些 skill 只是品質指引（像 python-patterns 提供 PEP 8...

.npmignore 少一行，512K 行原始碼見光——Claude Code 洩漏事件全解析

發表於2026-04-02|AI開發工具

2026 年 3 月 31 日 UTC 凌晨 4 點，Anthropic 把 Claude Code v2.1.88 推上 npm。23 分鐘後，一位累積 190 萬美元漏洞賞金的安全研究員在 X 上發了一則貼文，引爆了 AI 開發工具史上最大的原始碼洩漏事件。 512,000 行 TypeScript。1,900 個檔案。44 個未開放的 Feature Flags。全部見光。而最諷刺的是，這家公司的品牌定位是「安全至上」。一個 .npmignore 的遺漏如何釀成災難事情的根因簡單到令人難以置信。 Claude Code 用 Bun 做 bundler。Bun 預設會產生 source map 檔案——一個 59.8 MB 的 cli.js.map，用來把打包後的程式碼對應回原始 TypeScript。這個檔案指向 Anthropic 的 Cloudflare R2 儲存桶上一個 zip 壓縮檔，裡面裝著完整的未混淆原始碼。正常流程下，.npmignore 應該排除這個檔案。但不知道是哪個環節出了問題，它被一起推上了公開的 npm registry。更慘的是，Bun...

你的 AI 產品準備好被審計了嗎？美國兩部法案正在搶著定義規則

發表於2026-03-28|AI法規

3 月 18 日，美國參議員 Marsha Blackburn 丟出了一份近 300 頁的法案討論稿：TRUMP AMERICA AI Act。幾乎同時，參議員 Edward Markey 推出了 AI Civil Rights Act。兩部法案都要求對高風險 AI 系統做獨立的第三方偏見審計。但它們對「什麼是偏見」的定義完全不同，對「誰該負責」的看法也截然相反。如果你的 AI 產品面向美國市場，這不是「未來的問題」。這是現在進行式。兩部法案在吵什麼TRUMP AMERICA AI Act核心主張：聯邦法統一全國規則，取代各州自己搞的法規拼裝車。關鍵條款：風險分級制度：高風險 AI（醫療、信貸、招聘、關鍵基礎設施）需要強制審計和人工監督；低風險 AI 只需要資訊揭露年度偏見審計：高風險系統必須由獨立第三方做年度審計，特別檢測觀點歧視和政治傾向歧視廢除 Section 230：AI 公司不再能用「我只是平台」來免責聯邦搶佔州法：通過後，各州的 AI 法規全部失效，只認聯邦標準最後一條是最具爭議的。它意味著科羅拉多州、伊利諾州、紐約市這些已經實施的 AI...

當攻擊者也有了 AI Agent：地下論壇討論量暴增 1500%，agentic 攻擊框架長什麼樣

發表於2026-03-28|AI資安

Flashpoint 的 2026 全球威脅情報報告揭露了一個數字：2025 年 11 月到 12 月之間，地下論壇裡關於「用 AI 做壞事」的討論從 36.2 萬則暴增到超過 600 萬則。漲幅 1,500%。這不再是「用 ChatGPT 寫釣魚信」的等級。攻擊者已經建出了全自動化的 agentic 攻擊框架——能自主執行偵察、產生釣魚內容、測試竊取的憑證、輪換基礎設施，整個過程不需要人類持續介入。從好奇到量產：地下論壇裡發生了什麼Flashpoint 的研究團隊分析了 2025 年 1 月到 7 月間數十個網路犯罪論壇的對話。活動集中在 XSS、BreachForums、Dread 和 Exploit.in 這幾個知名平台。四個主題佔據了絕大部分討論：劫持主流 AI 服務：繞過 ChatGPT、Claude 的安全限制，讓它們產生惡意內容推銷犯罪用 AI 產品：專門為攻擊設計的 AI 工具，在論壇上像 SaaS 一樣販售微調模型做特定攻擊：針對特定產業或攻擊類型調整模型討論操作風險：用 AI 攻擊時如何避免被追蹤到了 11、12...