分類: 工具與生產力

發表於2026-07-27|AI工具實戰工具與生產力

這週看到 GigaToken 的標題，我第一個反應是先找測試機規格。「比 Hugging Face Tokenizers 快約 1000 倍」很難不點。但官方那筆 989 倍跑在雙路 AMD EPYC 9565，共 144 核心；另一筆 Apple M4 Max 甚至超過 1200 倍。這些數字是真的，直接搬到一般開發機上就很可疑。我讓 Codex 在我的 Windows 筆電建一個乾淨環境，拿實際開發專案裡的公開套件程式碼重跑。最後沒有 1000 倍。資料先讀進記憶體時，套件 CLI 回報的三次倍率落在 39.86～49.77 倍，中位數 43.55 倍；把磁碟讀取也算進去，中位數剩 15.57 倍。少掉一個零之後，速度仍然很兇。我的測試環境這次用的是一台已經不新的開發筆電： Windows 11 AMD Ryzen 7 4800H，8 核心、16 執行緒 16 GB 記憶體 Python 3.12.2 gigatoken 0.10.0 tokenizers 0.23.1 GPT-2 tokenizer 語料來自 Hexo 專案 node_modules 裡的 JS...

Fable 5 只有一次機會，我沒叫它寫程式：讓最強模型幫接班的弱模型立制度

發表於2026-07-07|AI工具實戰工具與生產力

上一篇結尾我寫，解禁之後我不會再像三週前那樣三天燒掉 70% 的用量。這句話我做到了——Fable 5 回來一週，我只給手上的環境排了一場 session。用在哪，我想了兩天。我有一套跑了兩個多月的 Claude Code 工作流：每 15 分鐘一輪盤中 cron、31 個 launchd 排程，幫我看美股台股、推 Telegram，還有一個只碰模擬盤的自動下單流程。平常由 Opus 4.8 看家、子任務丟給 Sonnet。這套東西最大的問題從來不是功能不夠，是每次換模型、每次 context 被壓縮，行為就開始飄——規則還躺在檔案裡，執行的卻已經不是同一顆腦袋。所以這場唯一的 Fable 5 session，我沒叫它寫任何功能。我叫它把自己的判斷力寫成檔案，留給之後接班的弱模型。理由很簡單：功能寫完就擺在那，下一顆模型照樣可能把它改壞；制度才會在我不盯著的時候，繼續擋住每一顆接班的模型。開場第一句：禁止動任何檔案我 prompt 的第一段就是熔斷指令：立刻停止一切寫入，禁止建立或修改任何檔案。先做的是逆向推導。我給了三個弱模型跑長任務的典型死法，要它對照我這套環境，...

Hexo blog 想加 iOS 風炫過場？跑半天 morph 沒成，反而發現自己藏了 84MB 圖片巨石

發表於2026-06-22|工具與生產力前後端開發

昨天晚上看了 Coding2GO 一條 5 分 46 秒的影片，講 CSS View Transition API 終於支援跨文件了——純 CSS 兩頁各加幾行（同源 + 兩頁都 @view-transition { navigation: auto; }）、靜態網站也能做出 SPA 風的換頁過場。我當下就想到自己那個 Hexo blog：能不能加上 iOS 相簿那種「點縮圖、圖飛進去變大圖」的 morph 效果？今天動手，跑半天 morph 沒成。但 debug 過程裡順手 PowerShell 抓了一下封面圖檔大小——35 張總共 84.3MB，平均 2.4MB 一張。結果 morph 收手，反而把整站圖片壓掉 93%（84MB → 6MB）。本來想搞炫的，沒成；結果抓到真正拖慢網站的東西。記錄一下這次的過程。原本的目標清單下班前的 2 小時 budget，我想要的兩個東西：整頁 cross-fade 換頁過場（基本款） list 縮圖 → 詳情頁大圖的 hero morph（進階款）我以為大半是 CSS 的事，看起來很簡單。估了 2 小...

Claude Code 跑完那個長 session 到底幹了什麼？Her 把 .jsonl 變成一份審計報告

發表於2026-06-08|AI工具實戰工具與生產力

你有沒有認真算過，Claude Code 幫你跑完一個長 session，到底燒了多少 token、按了哪些工具、有沒有在你沒盯著的時候改了什麼設定、碰了哪一把金鑰？我沒有。多數時候我就是看著它一條條工具呼叫往下刷，跑完、能用、收工。中間那一大段，基本是個黑盒——我信任它，但我沒看。前幾天看到一個叫 Her（天城文寫作 हेर）的工具，就是來幹這件事的——把那段沒人在看的過程，變成你看得懂的東西。先講清楚：我還沒實際把自己的 session 餵進去跑過，下面講的是讀了它的設計和文件之後的判斷，不是實測評測。但它的一個設計取捨很值得拿出來講。跑完一個長 session，你真的知道它幹了什麼嗎每一次 Claude Code 的 session，都會在硬碟上留下一個 .jsonl 檔——裡面記著每一輪對話、每一次工具呼叫、每一筆 token 花費。這個檔一直在那，只是沒人會去讀。它又長又密，是寫給機器看的，不是寫給人看的。問題是，當你越來越放手讓 agent 自己跑——讓它部署、讓它改設定檔、讓它接觸生產環境——這個沒人讀的檔裡，就藏著一些你其實該知道的事。它有沒有在第 40 ...

AI 寫的 code 一直要打掉重練？Spec Kit 想用一份可執行規範終結 vibe coding

發表於2026-06-08|AI工具實戰工具與生產力

我用 AI 寫 code 兩年多，最常打掉重練的，不是那些真的很難的演算法，而是一句話沒講清楚惹出來的麻煩。「幫我做一個檔案上傳功能。」AI 三十秒丟回一坨能跑的東西，介面有了、錯誤處理也有了。然後我才發現：它預設存本地磁碟，而我要的是上傳到物件儲存；它沒驗副檔名；50MB 的檔直接讓記憶體爆掉；前端完全沒有上傳進度。於是我追加一句 prompt，它改；再追加一句，它改歪了別的地方，把剛才好好的錯誤處理弄不見了。一個下午過去，那個「三十秒就好」的功能還在原地打轉。這不是模型笨。是我從頭到尾沒給它一份講清楚的合約。三十秒生出來的東西，為什麼一個下午還收不了尾這就是現在大家在做的事，英文叫 vibe coding——憑感覺對 AI 下指令，看它生出什麼，不對再喊它改。它的賣點是快，問題也是快：你把「想清楚要什麼」這件事，從動手前延後到了看到結果之後。延後不等於省掉。需求遲早要補完，邊界遲早要劃清，只是現在改的對象，從你腦袋裡的設計，變成了一坨已經寫出來、還在長大的 code。改三次還行，改到第八次，新的 prompt 開始把前幾次講好的決定蓋掉——AI 不是忘了，是它老實照你...

AI agent 用什麼抓網頁？四個主流爬蟲工具，多數時候你只需要最便宜那個

發表於2026-06-04|AI工具實戰工具與生產力

上一篇我寫了件讓人有點不安的事：在 Cloudflare 的觀測範圍裡，對網頁的請求已經有超過半數來自機器、不是人。那篇談的是需求側——誰在抓。這篇換個角度，談供給側：這些機器，到底拿什麼在抓？問題是我自己的。我有一套夜班工作流，每天清晨讓 Claude Code 自動撈財經新聞、AI 文章、社群討論，整理成一份報告。撐起它抓取層的，目前主要是兩樣東西：Jina Reader 把網頁轉成乾淨 markdown，Agent-Reach 串各家平台。用了一陣子，我開始想——市面上那些更炫的 AI 爬蟲，Firecrawl、Crawl4AI、ScrapeGraphAI，要不要換、或該加進來？於是花了點時間把四個主流工具攤開比。結論有點反直覺：多數時候，你需要的是最便宜、最笨的那個。先搞清楚：功能重疊，但預設路線不同把它們擺在一起比，第一個陷阱是硬切成四個互不重疊的類別。這幾套工具都在增加功能：Jina Reader 已能按 schema 抽 JSON，Crawl4AI 也有 LLM extraction，Firecrawl 同時能 scrape、crawl 和 extract。比較...

Claude Code 動態工作流實戰：用一支 JavaScript 派一群子代理，順便算了筆 token 帳

發表於2026-06-03|AI工具實戰工具與生產力

Claude Code 最近多了一個功能叫動態工作流（dynamic workflows）：讓主代理在執行時，當場寫一支 JavaScript，生成並協調一群子代理——每個子代理有自己獨立的 context window 和一個聚焦的小目標。我前幾天用它做了件很實際的雜活：評估四個候選部落格選題，看哪個跟我既有文章庫重複、哪個值得寫。這篇把那支 script 整個攤開，講三件事——怎麼寫、parallel 和 pipeline 怎麼選、跑一次燒多少 token。為什麼不是「開更多分頁」那麼簡單你可能會想，並行做事，開幾個對話視窗不就好了？差別在 context。Claude Code 過去是「一個對話、一條 context」，所有東西擠在同一個上下文視窗。長任務這個模式有三個老毛病，官方發布時直接點名：智慧惰性（做到一半宣布完工）、自我偏好偏差（驗證自己的產出時護短）、目標漂移（對話太長、尤其壓縮過後忘了最初目標）。動態工作流的解法不是把單一 context 養得更肥，而是把活切開：每個子代理拿一塊乾淨的上下文，做一件聚焦的事，彼此不互相汙染。並行只是順帶的好處，真正的價...

Gemini 漲 2 倍仍是美系最便宜、GPT 跟著漲、Claude 反而降——2026 年 AI API 三家定價分歧的真實意義

發表於2026-05-21|AI產業觀察工具與生產力

把過去半年三家 LLM 旗艦的價格軌跡攤開看，方向完全不同。 OpenAI 從 GPT-5（2025/08 發佈）的 $1.25/$10，經 GPT-5.4 的 $2.5/$15，到 2026/04/23 GPT-5.5 直接拉到 $5/$30——輸入價漲 4 倍、輸出價漲 3 倍。Google 從 Gemini 2.5 Pro（2025/06）的 $1/$10 漲到 Gemini 3 Pro（2025/11/18）的 $2/$12，再到 2026/05/19 推出 Gemini 3.5 Flash $1.5/$9（比自家 3.1 Pro 還便宜）。Anthropic 從 Claude 3 Opus 的 $15/$75 直接砍到 Opus 4.5（2025/11）的 $5/$25，之後 4.6、4.7（2026/04/16）三代都維持同價。 VC Tomer Tunguz 上週把這幾條曲線畫在同一張圖，下了一個短評：「補貼在現金充裕、市占重要的時候發生；漲價在現金緊、利潤重要的時候發生。」三家走的方向不同，意思就是他們現在缺的東西不一樣。對每個月開 API 帳單的人來說，這不...

微軟內部 Claude Code 被停用——同週 GitHub 備忘錄寫下「生存級風險」

發表於2026-05-21|AI產業觀察工具與生產力

2026 年 5 月 19 日那一週，微軟做了兩件看起來無關、其實是同一件事的事。第一件：The Information 報導微軟 Experiences + Devices 事業群取消大部分內部 Claude Code 授權，要求工程師在 2026 年 6 月 30 日前全面遷移到 GitHub Copilot CLI。第二件：同一週外流的內部備忘錄警告 GitHub 面臨「生存級風險」，因為 Cursor、Anthropic 的 Claude Code、OpenAI 等自主編程工具「削弱了把程式碼持續上傳到 GitHub 倉庫的必要性」。兩件事被各家媒體分開報導，但拼起來才看得到全貌。我認為這不是兩個故事，是同一個故事的因和果。六個月內從試用到強制下線先把時間線釘好： 2025 年 12 月：微軟開始邀請「數千名」內部開發者試用 Claude Code 2026 年 1 月：試用擴展至 Experiences + Devices 事業群全體，涵蓋 Windows、Microsoft 365、Outlook、Teams、Surface 工程團隊 2026 年 1 月起：...

打開 APEX 就藍屏重啟？用 PowerShell 事件日誌 10 分鐘找出元兇

發表於2026-04-08|工具與生產力系統與維運

按下 APEX 啟動鍵。讀取畫面跑完。然後——藍屏，重啟。再試一次。還是藍屏。這個問題困擾我好一陣子了。頻率不固定，有時候連開三場沒事，有時候進遊戲讀完畫面就炸。因為不是每次都觸發，排查起來格外惱人——你沒辦法穩定重現，就很難判斷到底是哪裡出問題。我走過的彎路我一開始懷疑是熱當。APEX 吃資源本來就兇，我的 GPU 溫度跑到八九十度是常態，藍屏的時間點又剛好在遊戲載入高峰，看起來太像過熱了。所以我先更新了顯示卡驅動。沒用。接著我把 APEX 的相關路徑全部加進火絨的安全區，怕是防毒軟體跟 EasyAntiCheat 打架。也沒用。問題就這樣斷斷續續，每隔幾天炸一次，炸完重開又能玩，讓人很難下定決心認真查。直到某天連續藍屏兩次，我受不了了，想到一件事——AI 現在不是很會讀 log 嗎？不如直接把事件日誌丟給它看。這個決定救了我大概一整個晚上的時間。 BSOD 0x0000001a 是什麼MEMORY_MANAGEMENT。聽起來嚇人，實際上這個停止碼涵蓋範圍很廣，代表 Windows 核心在管理記憶體時遇到嚴重的不一致狀態。溫度、驅動、防毒——我之前懷疑的方...