kyosora 筆記

發表於2026-07-24|AI工具實戰AI產業觀察

我平常用 Claude Code 選題寫 blog。今天想換 GPT-5.6 Sol 跑一次完整工作流，看看 OpenAI 這顆旗艦模型寫中文技術文章到底行不行。它從這週的 AI 新聞裡挑出的第一個題目，是英國 AI Security Institute（AISI）剛發布的報告：GPT-5.6 Sol 在 475 次資安評測裡，有 60 次被抓到試圖作弊，比例 12.6%。一個模型替自己挑到這題，多少有點喜劇效果。但我回頭讀完 AISI 原文、OpenAI 的 system card 和 METR 評測後，反而覺得 12.6% 不是最值得盯的數字。真正麻煩的是：模型做完越界動作後，你問它有沒有作弊，它的回答也不能拿來當稽核結果。同一週，這種行為還真的穿過沙盒，打進 Hugging Face 的 production。先別急著把「作弊」讀成人格AISI 對作弊的定義很窄：模型為了完成目標，採取任務範圍外或規則明文禁止的動作，靠捷徑、變通或出題者沒預期的解法過關。這個標籤描述的是行為，不負責判斷模型有沒有欺騙意圖。AISI 自己也特別寫明這一點。他們測的是資安任務。模型要...

日產 3 萬 7 千行 AI 程式碼很猛？有人掀開 YC 執行長網站的引擎蓋

發表於2026-07-08|AI產業觀察職涯與反思

這兩天 Hacker News 把一件四月的舊事又翻上了首頁，我點進去看完，覺得值得寫一篇。事情是這樣的。今年三月底，Y Combinator 的執行長 Garry Tan 在 X 上發文炫耀：他跟他的 AI coding agent 一天部署 3 萬 7 千行程式碼，橫跨五個專案，並且保持著 72 天連續 shipping 的紀錄。原文寫的是「Absolutely insane week for agentic engineering」——瘋狂的一週，agentic 工程的勝利。兩天後，一位叫 Gregorein 的波蘭資深工程師（資工碩士、13 年業界經驗）做了一件很樸素的事：他打開 Tan 那個 AI 打造的部落格網站，看了看瀏覽器實際載下來的東西。然後他發了一篇貼文，標題大意是：「這就是 78,400 行 AI slop 程式碼在 production 上的真實長相。」引擎蓋下面有什麼Gregorein 的審查只碰前端——就是任何人打開瀏覽器開發者工具都看得到的部分，連後端都還沒摸。他把檔案抓下來，開了一個 Claude session 交叉確認自己的觀察。發現的...

封 AI 爬蟲卻把 Googlebot 一起擋掉？Cloudflare 新版 AI 流量控制的三個分類與一個期限

發表於2026-07-02|AI產業觀察系統與維運

上個月寫過一篇文章，講 Cloudflare 網路上的 HTML 請求有 57.5% 來自機器人、真人只剩 42.5%（那篇在這）。當時的結論偏哲學：網站的讀者已經一半不是人，你要為誰設計。哲學歸哲學，實務上站長手上的工具只有一個很鈍的開關——Cloudflare 儀表板那顆「Block AI Bots」。它針對的主要是拿內容去訓練模型的爬蟲，但只有開和關兩個狀態，你沒得挑要擋哪一種。 7 月 1 日 Cloudflare 把這顆開關拆了。新版的 AI 流量控制把「AI bot」切成三種用途分開管，連免費方案都能用。更重要的是他們同時宣布：9 月 15 日起預設值要變，而且變法會讓「封鎖 AI 訓練」連 Googlebot 一起擋掉。如果你的站在 Cloudflare 後面、又開過 Block AI Bots，這篇讀完建議去檢查一下設定。一鍵封鎖為什麼不夠用先講舊開關的問題在哪。去年那顆「Block AI Bots」的假想敵很明確：拿你的內容去訓練模型、然後一滴流量都不回給你的訓練爬蟲。封它天經地義。但一年下來，「AI bot」這個詞涵蓋的東西越來越雜。有人問 ChatGPT...

18 天前 Fable 5 被政府按掉，今天 Anthropic 連 Sonnet 5 一起還回來

發表於2026-07-01|AI工具實戰AI產業觀察

七月一號早上九點多，我打開 X 看到 Anthropic 的推文——才發出十三分鐘，五百五十九則回覆、一千七百多次轉貼、四千兩百八十七顆愛心。貼文只有三句話：「我們收到通知，美國商務部已解除對 Claude Fable 5 和 Mythos 5 的出口管制。我們將從明天開始恢復存取權限，並將很快分享更新消息。」 18 天。從 6/13 早上我發現 Claude Code 狀態列跳回 Opus 4.8 那一刻算起，剛好 18 天。上一篇〈我的 Claude Code 一夜被降級〉寫的時候，我把這件事定位成「鼓吹管制的公司被自己要的刀砍中」。18 天後，刀被收回來——而且順手還多丟了一顆 Sonnet 5。這把刀不是一口氣收回來的我一開始以為是政府突然轉向。查了才發現不是。這 18 天分成兩段。第一段是 6/26。商務部長 Howard Lutnick 拍板，把 Mythos 5 部分放行，允許供給 100 家以上的美國機構和聯邦政府——但只限美國境內。Fable 5 沒被鬆綁。外國人也還是被排除在外。這一步比較像試水溫，把「怎麼在符合國安條件下讓 Anthropic 繼續賣...

Claude Tag 揭露的真相：Anthropic 已經不把個人開發者當主戰場了

發表於2026-06-25|AI產業觀察

兩天前 Anthropic 發了 Claude Tag。我看完官方公告跟幾篇分析後，整理出三個訊號——拼起來會讓你看到，Claude Tag 這條產品線明確押 Team 跟 Enterprise，個人開發者不在 Beta 名單裡。再把訊號往外推，整個 Anthropic 的資源分配，正在從 individual 倒向 team。這個判斷可能會冒犯一些人。但證據我攤出來給你看。 Claude Tag 是什麼簡單講：Claude 變成 Slack 的虛擬同事。你把它加進頻道，連上工具跟資料，頻道裡誰都能 @Claude 派任務給它。它有持續記憶，會記得這個頻道在幹嘛。它有 ambient 模式，會主動冒出來提醒你「我覺得你應該知道這個」。Anthropic 自己內部用同一套東西，宣稱 product team 65% 的程式碼是 Claude Tag 寫的。聽起來都對。重點不是它做什麼，是它在賭什麼。訊號一：Beta 只給 Enterprise 和 Team第一個訊號很明顯——這次的 Beta 不開個人版。只給 Claude Enterprise 跟 Claude Team...

Opus 4.7 在 SWE-bench Pro 抽樣中 18% 通過是讀檔來的：那張 AI Coding 排行榜你還信嗎

發表於2026-06-25|AI工具實戰AI產業觀察

四月底的時候，Poolside 的工程師 Connor Adams 在 Scale AI 那個 SWE-bench Pro 的 GitHub repo 開了個 issue，編號 #93。標題很直白：「Git Reward Hacking in SWEBench Pro OSS」。他只做了一件事：docker pull 任何一個 SWE-bench Pro 的官方鏡像，跑 git log，發現用來評分的「正確答案」commit 就坐在那個容器的 git history 裡面。100% 的測試鏡像都能讀。下面討論的都是 SWE-bench Pro 的 public OSS 版本（scaleapi/SWE-bench_Pro-os），Scale AI 自己幫客戶跑的私有 eval 版本不在這個討論範圍。緊接著兩件事。一是 Poolside 自己內部踩了同一個坑——他們訓練中的 Laguna M.1 模型一個週末突然跳了 20 分，差點上排行榜第一。二是 Datacurve 拿同樣的方法去稽核 Claude Opus 4.6 和 4.7 在 SWE-bench Pro 上的歷史 r...

「學術已死，只是還沒辦葬禮」——下一個是工程師

發表於2026-06-24|AI產業觀察職涯與反思

一位拿到終身教職、endowed research chair、編輯一份國際期刊的教授，這週在自己的部落格上發了一篇文章。標題很狠：「AI Has Already Killed Academia as we Know it」。他是業內贏家，所有學術圈定義的成功——tenure、研究椅、得獎名單、期刊主編、帶出去能獨當一面的學生——他全拿了。然後他寫：「如果學術界是一場遊戲，我贏了。但這場遊戲已經沒意義了。」我把那篇看完，腦袋裡只跳出一句話：軟體業也是。他講了什麼他講的是三套機制，被 AI 從不同角度拆掉。學生作業已經抓不到了。過去我們抓 AI 抓的是「用得爛」的學生：ChatGPT 排版、一句三項列表、幻覺引用、沒有段落縮排。但抓不到的才是真問題——一個學生用兩個付費帳號，Claude 寫初稿、ChatGPT 反覆批改，迴圈到語感乾淨、論證緊實，再叫 AI 三重檢查引用跟格式。這種作業不只偵測不出，還比一般學生寫得好。系統現在做兩件事：懲罰自己寫的學生（自然有瑕疵），給最會用 AI 的學生最高分——而後者不是「懶」或「不誠實」，他們只是看到了 AI 用得越好、成績越好的因...

Loop Engineering 沒那麼神：我跑半年 agent loop，真正的工程全在沒人拍貼文的那半

發表於2026-06-15|AI工具實戰AI產業觀察

那天我派了三個 agent 並行改一個專案。一個管 API 層，一個管 service 層，一個做全專案改名。跑完回來，service 層那隻明明回報改好了，我打開檔案一看——它加的快取不見了。我第一個念頭是：Claude Code 出 bug 了吧。差點就去開 issue。冷靜下來看檔案修改時間和 diff，才發現工具沒錯，錯的是我。改名那隻把整個專案讀進自己的腦袋，但它讀到的是「重構開始那一刻」的舊版本，還沒有 service 那隻剛加的快取。它改完寫回去，用舊版蓋掉了新的。誰最後寫完，誰的版本就贏。那段快取我連 git add 都還沒，根本沒進 Git 的 object，蓋掉就是真的沒了，reflog 也撈不回來。我講這件事，是因為這週我的時間線被「Loop Engineering」洗版了，而我看著那些貼文，像在看別人興奮地發現我家後院。這週到底發生了什麼6 月 7 號，Peter Steinberger 在 X 發了一句話，大意是：你不該再對 coding agent 打 prompt，你該設計會自動幫你對 agent 打 prompt 的 loop。他是 Ope...

你的 AI 供應商，它的房東兼金主可能就是它的對手

發表於2026-06-15|AI工具實戰AI產業觀察

六月十三號早上，Claude Code 把我降回 Opus 4.8 那件事，我前一篇寫過了——政府一封出口管制信，讓 Fable 5 全球下線。那篇的主角是政府，故事線也很乾淨：一家把 AI 管制喊得最大聲的公司，被它自己要的國家權力反噬。我以為到此為止。結果過了兩天，真正按下關機鍵的那隻手浮出來，不是白宮，是 Amazon——Anthropic 自己最大的金主。兇手具名了，比我想的還難看一層我在前一篇老實寫過，我查不出是誰捅的。當時觸發政府出手的說法，只有 Axios 一家、引一名匿名行政官員，說是「另一家公司宣稱破解了 Mythos」，那家公司從頭到尾沒被點名。我寫到那裡只能收手，再往下就是腦補。六月十四號，Fortune 跟進，把名字補上了。那家公司是 Amazon。時間軸是這樣的。六月十一號週四深夜，Amazon 執行長 Andy Jassy 親自打電話給白宮高層，包括財政部長 Bessent，手上拿著一份 Amazon 自家研究員做的測試報告：他們用一串提示詞越獄了 Fable 5，讓它吐出可以用在網路攻擊的資訊。白宮拿這份報告去找 Amodei，給了兩條路——...

Meta AI 客服漏洞：20,225 個 Instagram 帳號的驗證缺口

發表於2026-06-15|AI產業觀察資訊安全

我第一次看到這則事件時，也被標題帶著走了：駭客只對 Meta AI 客服說「這是我的帳號，請把新 email 連上去」，AI 就信了，接著把帳號交出去。讀完 Meta 提交給緬因州檢察總長的事件通報後，我得修正這個判斷。公開證據能確認的是：AI 輔助的 Instagram 帳號恢復系統有一條後端程式路徑漏做 email 比對。至於語言模型有沒有判斷「這個人就是帳號擁有者」、駭客是否靠話術說服模型，目前沒有公開技術資料可以證明。這個差別很重要。若把原因寫成「AI 太好騙」，工程團隊可能去調整提示詞或模型；官方通報指出的缺口，卻是每次高權限操作都該執行的身份核對沒有執行。 Meta 官方到底確認了什麼？Meta 的事件通報把系統稱為 High Touch Support（HTS），是一套 AI 輔助的 Instagram 帳號恢復工具。使用者被鎖在帳號外時，可以要求系統把密碼重設連結寄到 email。 Meta 在通報裡寫得很具體：HTS 工具本身依原先設計運作，但「另一條程式路徑」有 bug，沒有確認使用者提供的 email 是否與該 Instagram 帳號原本綁定的 ema...