我的 Claude Code 一夜被降級:鼓吹 AI 管制最力的公司,被自己要的刀砍中
六月十三號早上,我打開 Claude Code 想接著昨天的專案稽核,發現它不對勁。 回答變慢、變保守,連我前一天問都不眨眼的東西,現在開始猶豫。狀態列那行模型名稱,從 Fable 5 變回了 Opus 4.8。 我第一個念頭是自己把額度燒爆了——畢竟這三天我用得很兇,週限制已經吃掉七成。第二個念頭是網路或帳號出問題。查了一輪都不是。真正的原因比這些都荒謬:Fable 5 不是只對我關掉。美國政府前一天傍晚下了一道命令,禁止任何外國公民存取;Anthropic 說為了確保合規,只能對全球所有客戶停用它。台灣這邊我隔天一早就撞上牆。 我為什麼三天就燒掉七成週限制先講我怎麼會用到這個地步。 Fable 5 是 Anthropic 六月九號發布的最強模型,我當天就接上 Claude Code。第一天我開了 Ultracode 模式(Claude Code 裡火力全開、會派一群子代理平行幹活的模式),拿它去掃一個專案做全面稽核,一趟下來燒掉 11% 的週限制——是貴,貴得有感。但它在那個我自己掃過好幾輪的專案裡,揪出了我和其他模型都漏掉的問題。我那時還想,這個價錢換這種準度,划算。 還有...
OpenAI 說「聊天已死」,但死的不是聊天——是靠聊天賺錢這件事
2026 年 6 月初,OpenAI 一位資深員工對英國《金融時報》丟出一句話:「Chat is dead.」聊天已死。 緊接著的消息是:ChatGPT 要迎來上線以來最大的一次改版。介面重做,未來幾週陸續上線,主動把你往三個地方推——寫程式的 Codex、圖像生成、以及 Canva、Booking.com 這些外部夥伴做的 App。負責 OpenAI 核心產品的 Thibault Sottiaux 描繪的願景是:你有一個屬於自己的 agent,能在工作和生活的每一件事上幫你。 聊天框退到後面,agent 走到台前。這是新聞講的故事。但我把這幾條消息擺在一起讀,看到的是另一個故事。 先別急著相信「聊天已死」「聊天已死」是個漂亮的句子,漂亮到值得懷疑。 死了嗎?ChatGPT 現在每週有超過 9 億活躍用戶、5000 萬付費訂閱。一個每週被 9 億人打開的介面,很難說它「死了」。對絕大多數人來說,打開一個框、打一句話、拿到答案——這套互動順得很,沒有壞掉,也不需要被搶救。 所以這句話真正的意思,不是聊天這個「介面」死了。我認為它說的是另一件沒講出口的事:靠賣聊天訂閱來養這家公司,這...
一個北海道西蘭花農把 Codex 當工程師用,比任何「AI 取代工程師」的爭論都有說服力
前幾天滑到一則整理貼文,主角是北海道一個種田的農民,富安(Hiroki Tomiyasu),列了他這一年用 ChatGPT 和 Codex 做過的事。我看完愣了一下。 先說清楚他不是玩票的小菜農:經營約 100 公頃,種西蘭花、南瓜、青蔥、大豆,有曳引機要跑。但他本行就是種田——用日本媒體的說法,是個「程式知識為零的文科農家」。而那一串他做出來的東西,每一件我都大概知道「正規做法」要花多少錢、要請什麼樣的人。他一個人,靠一個聊天框,全做了。 他做了什麼挑幾個我覺得最有代表性的講。 他拍一張西蘭花的照片丟給 AI,問這是什麼病。這個你可能覺得還好,手機 App 早就能做。但接下來的就不太一樣了。 他用衛星資料抓自己田的 NDVI。NDVI(Normalized Difference Vegetation Index,歸一化植被指數)是用衛星的近紅外和紅光波段算出來的一個值,反映植物長得有多茂盛、多健康——數值越高通常代表越健康,不過確切門檻會隨作物、生長期、感測器而變。這是精準農業在用的東西,正規的農業遙測服務多半要付費訂閱,他則是自己串免費的衛星資料,把影像疊到自家田的地圖上看。...
57.5% 的網頁請求已經不是人類——你的網站還在只為真人設計嗎
這篇文章的題目,是一個機器假扮成人類、去敲另一台機器的門撈回來的。 今天我想更新部落格,照慣例讓 Claude Code 上網找找熱點。它撈資料的指令我順手看了一眼——curl 後面掛著一長串 Mozilla/5.0 ... Chrome/124.0.0.0 Safari/537.36 的 User-Agent。那串字翻成白話是:「我是一個人類,正在用 Chrome 瀏覽器」。但下指令的不是人,是我的 AI 工具;它連的也不是給人看的網頁,是一個只吐 JSON 的 API。原因很實際:那個 API 用 nginx 擋掉所有看起來像程式的請求,預設的 curl/8.x UA 會被直接 403 回絕。所以為了幫我這個真人找今天的新聞,機器得先假裝自己也是個正在滑網頁的人。 撈回來的那堆 JSON 裡,有一條新聞正好在講這件事的全貌。 過了那條線:57.5% 對 42.5%2026 年中,一個分水嶺數字開始在圈子裡流傳:在 Cloudflare 網路上、對 HTML 網頁內容的 HTTP 請求裡,57.5% 來自機器人,只有 42.5% 來自真人瀏覽器——這是 Cloudflare R...
六月 AI 模型大戰前夕:GPT-5.6、Gemini 3.5 Pro、Claude Mythos 同時壓境,開發者怎麼準備?
2026 年 5 月最後一週,GPT-5.6 在 Codex 後端日誌裡被挖出來、Anthropic 的 Mythos 推翻了一個近 80 年的數學猜想、WWDC 很可能揭露 Gemini 驅動的新 Siri。如果這些消息有一半成真,六月的模型名稱、API 規格、token 單價會同時變動,留給開發者的切換視窗很短。 我三月寫過一篇模型大亂鬥,當時的結論是「沒有全能冠軍」——這句話到現在還適用。這次要聊的不是跑分比較,而是一個更實際的問題:你的系統架構裡,模型名稱寫死了幾處?錯誤碼寫死了幾處?stream chunk 格式寫死了幾處? 備戰清單放前面,後面的情報分析都服務這份清單。 開發者備戰清單(六月前完成)1. 把 LLM 呼叫抽象出來 如果你的程式碼裡直接寫死 openai.chat.completions.create(),六月切模型會很痛苦。不需要複雜框架,一個 adapter 層就夠。核心是把模型選擇和業務邏輯分開。 1234567891011121314151617181920212223242526272829// 這是整理過的示意,實際版本會更簡單interfa...
沒有「取代所有人」的臨界點——讀 Dan Shipper 的〈After Automation〉
我們這行最近最焦慮的一個問題是:下一個模型發布,會不會就是把我們全部換掉的那一個? Every 的執行長 Dan Shipper 在〈After Automation〉裡給的答案是:沒有那一天。不是因為 AI 不夠強,而是因為這個問題本身問錯了。這篇文章值得每個天天用 Claude Code、Codex 寫程式的人讀一遍——它把「AI 越強、人類越沒事做」這個直覺,整個翻了過來。 我把它的論點整理成下面幾條,順便講講我自己半年下來、哪裡認同、哪裡存疑。 一個反直覺的前提:越自動化,人類工作越多Shipper 開頭就攤牌:Every 這家三十人左右的公司,把能自動化的全自動化了——寫程式、寫稿、設計、客服,全靠 Codex 和 Claude Code。他們搶先測試 OpenAI、Anthropic、Google 還沒發布的模型。照理說人應該越用越少。 結果相反。他們沒有裁掉所有員工換成 agent,還是請真人寫稿、編輯、工程師、客服。工作的「形態」完全變了——沒人手寫程式碼了,Slack 上 tag 一個人你還不確定對方是真人還是 agent——但事情比以前更多。 Shipper ...
400 tps 是分水嶺:智譜 GLM-5.1 高速版能解決哪些工程瓶頸
智譜 5/22 對部分企業客戶推出 GLM-5.1 高速版,API 輸出速度達 400 tokens/s。新聞標題是「全球最快」,但這個說法不嚴謹——Cerebras 跑 Llama 405B 早就破 900 tps。真正值得單獨講的不是「誰快」,而是 400 tps 在工程上意味著什麼。 這篇不是寫智譜的 PR 稿。我關心的問題是:旗艦級大模型過了某個速度門檻之後,工程師能做的事會出現質變——這個門檻大概在哪裡?哪些場景真的能因此解鎖?哪些只是看起來很厲害的行銷數字? 速度光譜定位先把 400 tps 放到正確的座標上。市面上幾個常見的推理速度: 模型 / 平台 輸出速度 性質 GPT-5 / Claude Sonnet 4.6(標準 API) 60-120 tps 旗艦級的「典型」速度 Groq LPU 跑 Llama 70B ~280 tps 中型模型 + 客製晶片 智譜 GLM-5.1 highspeed 400 tps 旗艦級 + 純軟體優化 Cerebras WSE-3 跑 Llama 405B ~970 tps 旗艦級 + 晶圓級晶片 人...
90% 到 99% 之間的工程戰爭:Cursor 雲端 Agent 一年實戰拆解
Cursor 在 5/21 釋出一篇「What we've learned building cloud agents」,作者是 Josh Ma。看起來像普通的工程經驗總結,但藏了一個讓我看完盯著螢幕想很久的數字:他們把 Cursor 內部 monorepo 的 40% PR 交給雲端 Agent 寫,而且這個比例還在漲。 這套系統最後支撐到 40% 之前,他們花了一年——不是「把本地 Agent 搬到伺服器」那種一年,而是把可靠性從 90%(一個九)拉到 99%(兩個九),中間放棄了自研架構、改用 Temporal、重新拆解了 agent、機器、對話三個狀態。 我自己沒做過 cloud agent 產品,但這篇花了一個下午消化,因為文章拆出來的五個學習,每一個都是「想做 AI Agent SaaS 的人遲早會撞上的牆」。寫一篇給台灣中階開發者看的拆解版。(附帶一個小插曲:中文 AI 資訊聚合站把原文的 "two nines" 翻成「99.9%」,實際是 99%。讀任何技術摘要,最後一步都要回原文校對。) 第一個坑:以為雲端 Agent 就是把本地 A...
xAI 一年虧 64 億、OpenAI 燒不出獲利、NVIDIA 一季淨賺 583 億——AI 鏈條真正賺錢的位置
2026 年 5 月 20 日這一天,三條財經新聞在同一時間冒出來。 第一條:NVIDIA 公布 FY27 Q1 財報——單季營收 816 億美元(+85% YoY)、淨利 583 億美元(+211%)、毛利率 74.9%、宣布 800 億美元股票回購、預測下季 910 億美元營收。 第二條:SpaceX 提交 IPO 招股書,順帶揭露剛被併入的 xAI 2025 年財務——全年虧損 64 億美元,營收 32 億,CapEx 127 億。SpaceX + xAI 合併後 2025 全年淨虧 49.4 億。 第三條:CNBC 報導 OpenAI 最快本週五提交 IPO 招股書草案,目標 2026 年 9 月上市,私募估值 5000 億美元,但訓練 + 推理 CapEx 長期遠高於營收,是公開的賠錢業務。 三條新聞放在同一張表上,AI 鏈條真正賺錢的位置就一覽無遺了。所有做模型的公司都在燒錢,賣 GPU 的那家一季淨賺一個 OpenAI 估值 12% 的數字。 這個對比值得單獨拆一篇。 三家公司同一年的數字攤開先把三組數字釘在桌上: 公司 期間 營收 利潤/虧損 補充 N...
Gemini 漲 2 倍仍是美系最便宜、GPT 跟著漲、Claude 反而降——2026 年 AI API 三家定價分歧的真實意義
把過去半年三家 LLM 旗艦的價格軌跡攤開看,方向完全不同。 OpenAI 從 GPT-5(2025/08 發布)的 $1.25/$10,經 GPT-5.4 的 $2.5/$15,到 2026/04/23 GPT-5.5 直接拉到 $5/$30——輸入價漲 4 倍、輸出價漲 3 倍。Google 從 Gemini 2.5 Pro(2025/06)的 $1/$10 漲到 Gemini 3 Pro(2025/11/18)的 $2/$12,再到 2026/05/19 推出 Gemini 3.5 Flash $1.5/$9(比自家 3.1 Pro 還便宜)。Anthropic 從 Claude 3 Opus 的 $15/$75 直接砍到 Opus 4.5(2025/11)的 $5/$25,之後 4.6、4.7(2026/04/16)三代都維持同價。 VC Tomer Tunguz 上週把這幾條曲線畫在同一張圖,下了一個短評:「補貼在現金充裕、市占重要的時候發生;漲價在現金緊、利潤重要的時候發生。」 三家走的方向不同,意思就是他們現在缺的東西不一樣。 對每個月開 API 帳單的人來說,這不...












