kyosora 筆記

我的 Claude Code 一夜被降級：鼓吹 AI 管制最力的公司，被自己要的刀砍中

發表於2026-06-13|AI工具實戰AI產業觀察

六月十三號早上，我打開 Claude Code 想接著昨天的專案稽核，發現它不對勁。回答變慢、變保守，連我前一天問都不眨眼的東西，現在開始猶豫。狀態列那行模型名稱，從 Fable 5 變回了 Opus 4.8。我第一個念頭是自己把額度燒爆了——畢竟這三天我用得很兇，週限制已經吃掉七成。第二個念頭是網路或帳號出問題。查了一輪都不是。真正的原因比這些都荒謬：Fable 5 不是只對我關掉。美國政府前一天傍晚下了一道命令，禁止任何外國公民存取；Anthropic 說為了確保合規，只能對全球所有客戶停用它。台灣這邊我隔天一早就撞上牆。我為什麼三天就燒掉七成週限制先講我怎麼會用到這個地步。 Fable 5 是 Anthropic 六月九號發布的最強模型，我當天就接上 Claude Code。第一天我開了 Ultracode 模式（Claude Code 裡火力全開、會派一群子代理平行幹活的模式），拿它去掃一個專案做全面稽核，一趟下來燒掉 11% 的週限制——是貴，貴得有感。但它在那個我自己掃過好幾輪的專案裡，揪出了我和其他模型都漏掉的問題。我那時還想，這個價錢換這種準度，划算。還有...

OpenAI 說「聊天已死」，但死的不是聊天——是靠聊天賺錢這件事

發表於2026-06-08|AI產業觀察

2026 年 6 月初，OpenAI 一位資深員工對英國《金融時報》丟出一句話：「Chat is dead.」聊天已死。緊接著的消息是：ChatGPT 要迎來上線以來最大的一次改版。介面重做，未來幾週陸續上線，主動把你往三個地方推——寫程式的 Codex、圖像生成、以及 Canva、Booking.com 這些外部夥伴做的 App。負責 OpenAI 核心產品的 Thibault Sottiaux 描繪的願景是：你有一個屬於自己的 agent，能在工作和生活的每一件事上幫你。聊天框退到後面，agent 走到台前。這是新聞講的故事。但我把這幾條消息擺在一起讀，看到的是另一個故事。先別急著相信「聊天已死」「聊天已死」是個漂亮的句子，漂亮到值得懷疑。死了嗎？ChatGPT 現在每週有超過 9 億活躍使用者、5000 萬付費訂閱。一個每週被 9 億人打開的介面，很難說它「死了」。對絕大多數人來說，打開一個框、打一句話、拿到答案——這套互動順得很，沒有壞掉，也不需要被搶救。所以這句話真正的意思，不是聊天這個「介面」死了。我認為它說的是另一件沒講出口的事：靠賣聊天訂閱來養這家公司，...

一個北海道西蘭花農把 Codex 當工程師用，比任何「AI 取代工程師」的爭論都有說服力

發表於2026-06-08|AI產業觀察職涯與反思

前幾天滑到一則整理貼文，主角是北海道一個種田的農民，冨安（Hiroki Tomiyasu），列了他這一年用 ChatGPT 和 Codex 做過的事。我看完愣了一下。先說清楚這不是週末種種菜的規模：經營約 100 公頃，種西蘭花、南瓜、青蔥、大豆，有曳引機要跑。但他本行就是種田——用日本媒體的說法，是個「程式知識為零的文科農家」。而那一串他做出來的東西，每一件我都大概知道「正規做法」要花多少錢、要請什麼樣的人。他一個人，從一個聊天框問起，把這一串東西一件一件弄了出來。他做了什麼挑幾個我覺得最有代表性的講。他拍一張西蘭花的照片丟給 AI，問這是什麼病。這個你可能覺得還好，手機 App 早就能做。但接下來的就不太一樣了。他坐在曳引機的駕駛座上，當場用 AI 寫了一支記錄行駛軌跡的小程式——手機 GPS 抓時間和經緯度，跟自家田的邊界比對，把跑過的路線疊到地圖上，連里程和最高速度都記下來。新款的高階曳引機本來就附這類功能，但那是要另外掏大錢的；他人在駕駛座，邊開邊讓 Codex 改 code、當場跑測試，硬是自己把它生了出來。真正幫他省事的是溫室那套。他在棚裡擺了幾顆 Swi...

57.5% 的網頁請求已經不是人類——你的網站還在只為真人設計嗎

發表於2026-06-04|AI產業觀察前後端開發

這篇文章的題目，是一個機器假扮成人類、去敲另一台機器的門撈回來的。今天我想更新部落格，照慣例讓 Claude Code 上網找找熱點。它撈資料的指令我順手看了一眼——curl 後面掛著一長串 Mozilla/5.0 ... Chrome/124.0.0.0 Safari/537.36 的 User-Agent。那串字翻成白話是：「我是一個人類，正在用 Chrome 瀏覽器」。但下指令的不是人，是我的 AI 工具；它連的也不是給人看的網頁，是一個只吐 JSON 的 API。原因很實際：那個 API 用 nginx 擋掉所有看起來像程式的請求，預設的 curl/8.x UA 會被直接 403 回絕。所以為了幫我這個真人找今天的新聞，機器得先假裝自己也是個正在滑網頁的人。撈回來的那堆 JSON 裡，有一條新聞正好在講這件事的全貌。過了那條線：57.5% 對 42.5%2026 年中，一個分水嶺數字開始在圈子裡流傳：在 Cloudflare 網路上、對 HTML 網頁內容的 HTTP 請求裡，57.5% 來自機器人，只有 42.5% 來自真人瀏覽器——這是 Cloudflare R...

六月 AI 模型大戰前夕：GPT-5.6、Gemini 3.5 Pro、Claude Mythos 同時壓境，開發者怎麼準備？

發表於2026-05-27|AI工具實戰AI產業觀察

2026 年 5 月最後一週，GPT-5.6 在 Codex 後端日誌裡被挖出來、Anthropic 的 Mythos 推翻了一個近 80 年的數學猜想、WWDC 很可能揭露 Gemini 驅動的新 Siri。如果這些消息有一半成真，六月的模型名稱、API 規格、token 單價會同時變動，留給開發者的切換視窗很短。我三月寫過一篇模型大亂鬥，當時的結論是「沒有全能冠軍」——這句話到現在還適用。這次要聊的不是跑分比較，而是一個更實際的問題：你的系統架構裡，模型名稱寫死了幾處？錯誤碼寫死了幾處？stream chunk 格式寫死了幾處？備戰清單放前面，後面的情報分析都服務這份清單。開發者備戰清單（六月前完成）1. 把 LLM 呼叫抽象出來如果你的程式碼裡直接寫死 openai.chat.completions.create()，六月切模型會很痛苦。不需要複雜框架，一個 adapter 層就夠。核心是把模型選擇和業務邏輯分開。 1234567891011121314151617181920212223242526272829// 這是整理過的示意，實際版本會更簡單interfa...

沒有「取代所有人」的臨界點——讀 Dan Shipper 的〈After Automation〉

發表於2026-05-25|AI工具實戰AI產業觀察

我們這行最近最焦慮的一個問題是：下一個模型發布，會不會就是把我們全部換掉的那一個？ Every 的執行長 Dan Shipper 在〈After Automation〉裡給的答案是：沒有那一天。不是因為 AI 不夠強，而是因為這個問題本身問錯了。這篇文章值得每個天天用 Claude Code、Codex 寫程式的人讀一遍——它把「AI 越強、人類越沒事做」這個直覺，整個翻了過來。我把它的論點整理成下面幾條，順便講講我自己半年下來、哪裡認同、哪裡存疑。一個反直覺的前提：越自動化，人類工作越多Shipper 開頭就攤牌：Every 這家三十人左右的公司，把能自動化的全自動化了——寫程式、寫稿、設計、客服，全靠 Codex 和 Claude Code。他們搶先測試 OpenAI、Anthropic、Google 還沒發布的模型。照理說人應該越用越少。結果相反。他們沒有裁掉所有員工換成 agent，還是請真人寫稿、編輯、工程師、客服。工作的「形態」完全變了——沒人手寫程式碼了，Slack 上 tag 一個人你還不確定對方是真人還是 agent——但事情比以前更多。 Shipper ...

400 tps 是分水嶺：智譜 GLM-5.1 高速版能解決哪些工程瓶頸

發表於2026-05-22|AI工具實戰AI產業觀察

智譜 5/22 對部分企業客戶推出 GLM-5.1 高速版，API 輸出速度達 400 tokens/s。新聞標題是「全球最快」，但這個說法不嚴謹——Cerebras 跑 Llama 405B 早就破 900 tps。真正值得單獨講的不是「誰快」，而是 400 tps 在工程上意味著什麼。這篇不是寫智譜的 PR 稿。我關心的問題是：旗艦級大模型過了某個速度門檻之後，工程師能做的事會出現質變——這個門檻大概在哪裡？哪些場景真的能因此解鎖？哪些只是看起來很厲害的行銷數字？速度光譜定位先把 400 tps 放到正確的座標上。市面上幾個常見的推理速度：模型 / 平台輸出速度性質 GPT-5 / Claude Sonnet 4.6（標準 API） 60-120 tps 旗艦級的「典型」速度 Groq LPU 跑 Llama 70B ~280 tps 中型模型 + 客製晶片智譜 GLM-5.1 highspeed 400 tps 旗艦級 + 純軟體優化 Cerebras WSE-3 跑 Llama 405B ~970 tps 旗艦級 + 晶圓級晶片人...

90% 到 99% 之間的工程戰爭：Cursor 雲端 Agent 一年實戰拆解

發表於2026-05-22|AI工具實戰AI產業觀察

Cursor 在 5/21 釋出一篇「What we've learned building cloud agents」，作者是 Josh Ma。看起來像普通的工程經驗總結，但藏了一個讓我看完盯著螢幕想很久的數字：他們把 Cursor 內部 monorepo 的 40% PR 交給雲端 Agent 寫，而且這個比例還在漲。這套系統最後支撐到 40% 之前，他們花了一年——不是「把本地 Agent 搬到伺服器」那種一年，而是把可靠性從 90%（一個九）拉到 99%（兩個九），中間放棄了自研架構、改用 Temporal、重新拆解了 agent、機器、對話三個狀態。我自己沒做過 cloud agent 產品，但這篇花了一個下午消化，因為文章拆出來的五個學習，每一個都是「想做 AI Agent SaaS 的人遲早會撞上的牆」。寫一篇給台灣中階開發者看的拆解版。（附帶一個小插曲：中文 AI 資訊聚合站把原文的 "two nines" 翻成「99.9%」，實際是 99%。讀任何技術摘要，最後一步都要回原文校對。）第一個坑：以為雲端 Agent 就是把本地 A...

xAI 一年虧 64 億、OpenAI 燒不出獲利、NVIDIA 一季淨賺 583 億——AI 鏈條真正賺錢的位置

發表於2026-05-21|AI產業觀察職涯與反思

2026 年 5 月 20 日這一天，三條財經新聞在同一時間冒出來。第一條：NVIDIA 公布 FY27 Q1 財報——單季營收 816 億美元（+85% YoY）、淨利 583 億美元（+211%）、毛利率 74.9%、宣布 800 億美元股票回購、預測下季 910 億美元營收。第二條：SpaceX 提交 IPO 招股書，順帶揭露剛被併入的 xAI 2025 年財務——全年虧損 64 億美元，營收 32 億，CapEx 127 億。SpaceX + xAI 合併後 2025 全年淨虧 49.4 億。第三條：CNBC 報導 OpenAI 最快本週五提交 IPO 招股書草案，目標 2026 年 9 月上市，私募估值 5000 億美元，但訓練 + 推理 CapEx 長期遠高於營收，是公開的賠錢業務。三條新聞放在同一張表上，AI 鏈條真正賺錢的位置就一覽無遺了。所有做模型的公司都在燒錢，賣 GPU 的那家一季淨賺一個 OpenAI 估值 12% 的數字。這個對比值得單獨拆一篇。三家公司同一年的數字攤開先把三組數字釘在桌上：公司期間營收利潤/虧損補充 N...

Gemini 漲 2 倍仍是美系最便宜、GPT 跟著漲、Claude 反而降——2026 年 AI API 三家定價分歧的真實意義

發表於2026-05-21|AI產業觀察工具與生產力

把過去半年三家 LLM 旗艦的價格軌跡攤開看，方向完全不同。 OpenAI 從 GPT-5（2025/08 發佈）的 $1.25/$10，經 GPT-5.4 的 $2.5/$15，到 2026/04/23 GPT-5.5 直接拉到 $5/$30——輸入價漲 4 倍、輸出價漲 3 倍。Google 從 Gemini 2.5 Pro（2025/06）的 $1/$10 漲到 Gemini 3 Pro（2025/11/18）的 $2/$12，再到 2026/05/19 推出 Gemini 3.5 Flash $1.5/$9（比自家 3.1 Pro 還便宜）。Anthropic 從 Claude 3 Opus 的 $15/$75 直接砍到 Opus 4.5（2025/11）的 $5/$25，之後 4.6、4.7（2026/04/16）三代都維持同價。 VC Tomer Tunguz 上週把這幾條曲線畫在同一張圖，下了一個短評：「補貼在現金充裕、市占重要的時候發生；漲價在現金緊、利潤重要的時候發生。」三家走的方向不同，意思就是他們現在缺的東西不一樣。對每個月開 API 帳單的人來說，這不...