業務嫌你慢、AI 寫得比你快——資深工程師最大的盲點不在技術
寶玉前幾天轉了 Tuhin Nair 的一篇文章,標題是《為什麼資深開發者講不清自己的專業能力》。我點開看完,戳到了。 我以為作者要罵的是工程師不會表達、PPT 做得爛,結果他切的點完全不一樣——資深開發者根本不是不會講,是站在跟業務完全相反的迴圈裡,用一套對方聽不懂的邏輯在說話。 我做了七、八年系統,被業務嫌「擋路」「太保守」「想太多」的次數,自己都記不清。每一次我都覺得對方不懂技術,現在回頭看,是我自己沒搞清楚對方在解什麼問題。 兩個迴圈,從來沒在同一條跑道上Tuhin 的觀察很尖銳:業務團隊在跑的,是一個「消除不確定性」的迴圈——這個功能能不能賣?這個市場有沒有人要?這條廣告投放有沒有用?他們的工作就是不斷拋出假設、最小成本驗證、看結果再調整。對他們來說,速度是命。一週搞不定的事,三個月後可能整個議題都失效。 資深開發者跑的迴圈完全不一樣,是「管理複雜性」。 你維護的系統不是一個...
黃仁勳叫 CS 畢業生去當電工——一週內三位 AI 老闆都在預告同一件事
上週五,黃仁勳在卡內基梅隆大學的畢業典禮上對 2026 屆資工系畢業生說了句話:電工和水管工比你們有前景。 他不是在開玩笑。兩天後微軟 AI 部門的 CEO Mustafa Suleyman 接受 Fortune 採訪,預測 18 個月內 AI 會自動化掉所有「坐在電腦前」的白領工作。同一天 Anthropic CEO Dario Amodei 在華爾街日報的 YouTube 頻道說,軟體成本會崩到接近零,數十年累積的職業結構會跟著消失。 一週之內三位 AI 圈最有話語權的人放話,方向高度一致。我們得認真看看他們在說什麼——以及我們自己該怎麼辦。 一週內的三個訊號5/15,黃仁勳 @ CMU:給資工系畢業生的演講,主軸是「不要假設你選了一個鐵飯碗」。他引用的數據夠扎實: Randstad 分析顯示,技工的需求增長是白領職位的 3 倍 機器人技術員職位增長 107% 斯坦福研究指出,AI 相關崗位的早期職業就業率下降 16% 頂級電工年薪可以超過 10.6 萬美元,而且不用揹學貸 科技公司今年砸了 7000 億美元蓋資料中心,到 2030 年全球估計 7...
Anthropic 自己出手冊警告:AI 不是降低創業失敗率,是放大它
五月十四日 Anthropic 在自家部落格放出一份叫 Founder's Playbook 的內部手冊,主題是「怎麼用 AI 從零做一家 startup」。 結論反直覺:AI 會放大你的創業失敗模式,而不是降低失敗率。寫這份手冊的是 Anthropic 自己——賣你 Claude Code 的那家公司——提醒你它賣的工具會放大失敗。 我下載 PDF 那天剛好在抓一個 bug那天我在改公司專案的下載功能。PM 一直堅持是「SQL 抓不到資料」,花了快兩小時才發現根本不是——伺服器上的 LibreOffice 被 MODA ODF Application Tools 的安裝程式覆寫掉了,舊路徑變成空殼資料夾。 問題本身只是一行硬編碼路徑。難搞的是錯誤被四層補丁吞掉的方式:執行檔不見就拋例外、ConvertFile 沒產出檔還是寫 log 繼續跑、controller 對著不存在路徑 return File()、最外層 catch 把一切包成 Content("查無資料")。前端拿到 1,229 bytes 的「ODS 檔」(其實是 HTML...
跟 AI 說「這對我很重要」讓它表現提升 115%——論文怎麼解釋這件事
那個 115% 是怎麼來的我第一次看到這個數字的時候反應是「不可能吧」。 論文叫 Large Language Models Understand and Can be Enhanced by Emotional Stimuli,2023 年由 Microsoft、中科院、威廉與瑪麗學院等機構合作發表。研究方法很簡單:在 prompt 末尾加上一句情緒話語,例如「這對我的職涯非常重要」「我相信你可以做得很好」,然後看模型表現會不會變化。 結果是: 自動評測涵蓋 45 個任務(Instruction Induction + BIG-Bench),多個模型上都看到改善 另有 106 位受試者評估 30 個生成問題,EmotionPrompt 在 performance、truthfulness、responsibility 三項平均相對提升 10.9% 在 BIG-Bench 某些子任務上,相對改善飆到 115%(注意這是 relative improvement,在原始低基準任務上會被放大) 在 Flan-T5、Vicuna、Llama...
以為是 App Pool 的鍋,結果 IUSR 被 Windows 偷走了
上週為了讓同事拉一份檔案,我在測試機上把 IIS 專案資料夾開了個進階共用。東西傳完後我把共用關掉,繼續回頭改別的東西。 十分鐘後測試站同事回訊息:整個網站 HTTP 401,連 /favicon.ico 都打不開。 我第一個念頭是「我剛剛根本沒動 web.config 啊?」然後花了半小時繞遠路——這篇就是想分享這個坑,因為症狀跟原因之間的距離遠到不合理。 症狀 瀏覽器吃到 401 Unauthorized 連 CSS、圖片這類靜態檔都 401 IIS 沒有動過站點設定 專案程式碼沒動過 App Pool 跑得好好的,沒當機、沒停 重啟 IIS 沒用 翻開 IIS 記錄(C:\inetpub\logs\LogFiles\W3SVC...),關鍵那行: 12sc-status: 401sc-substatus: 3 401.3 的官方說明是 「Access is denied due to an ACL set on the requested resource」——翻譯:這不是 IIS 驗證設定的問題,是 NTFS 層級擋下來的。 我第一個走錯的方向本能反應是去翻 App...
以為寫完了:Claude Code 觀測 digest 的兩次設計
我一直以為 Claude Code 在靜默觀測我做的每件事。裝了 continuous-learning-v2 這個 skill,規則寫著「每輪對話自動抽取模式」、「任務結束時主動寫入知識庫」,加上 auto-skill 把產出綁到 Obsidian Vault——聽起來就像我敲的每一行指令都會被默默萃取成經驗。 然後我打開 Vault 的 auto-skill/experience/ 看一眼。 7 筆。 9 天 7 筆,其中 6 筆是某個下午當場叫 Claude 記的。真正「自動」產出的是 0 筆。 我愣了一下——這兩週敲出來的幾千次工具呼叫到底去了哪裡?還是根本沒被記? 規則沒壞,但產出為零auto-skill 的規則是這樣設計的:每輪對話抽關鍵詞、判斷話題切換、符合條件才主動問使用者要不要寫入。理論上很精巧,每次任務結束都會評估一下「這次解決的問題下次還能用嗎」,可以就寫。 問題是這個評估是我執行的,而我是一個對話結束就消失的程序。每一代 session 用自己那輪的「品質標準」判斷,標準會漂移,多數日常工作我會覺得「這沒什麼特別」就跳過。結果 9 天產出 1...
打開 APEX 就藍屏重啟?用 PowerShell 事件日誌 10 分鐘找出元兇
按下 APEX 啟動鍵。讀取畫面跑完。然後——藍屏,重啟。 再試一次。還是藍屏。 這個問題困擾我好一陣子了。頻率不固定,有時候連開三場沒事,有時候進遊戲讀完畫面就炸。因為不是每次都觸發,排查起來格外惱人——你沒辦法穩定重現,就很難判斷到底是哪裡出問題。 我走過的彎路我一開始懷疑是熱當。APEX 吃資源本來就兇,我的 GPU 溫度跑到八九十度是常態,藍屏的時間點又剛好在遊戲載入高峰,看起來太像過熱了。 所以我先更新了顯示卡驅動。沒用。 接著我把 APEX 的相關路徑全部加進火絨的安全區,怕是防毒軟體跟 EasyAntiCheat 打架。也沒用。 問題就這樣斷斷續續,每隔幾天炸一次,炸完重開又能玩,讓人很難下定決心認真查。直到某天連續藍屏兩次,我受不了了,想到一件事——AI 現在不是很會讀 log 嗎?不如直接把事件日誌丟給它看。 這個決定救了我大概一整個晚上的時間。 BSOD 0x0000001a 是什麼MEMORY_MANAGEMENT。聽起來嚇人,實際上這個停止碼涵蓋範圍很廣,代表 Windows...
你的 CLAUDE.md 超過 300 行了嗎?我用分層架構解決了三個問題
我的 CLAUDE.md 曾經有 800 多行。裡面塞了程式碼規範、交易哲學、小說寫作標準、TRPG 跑團引擎、150 個 skill 綁定,全部標「必須使用」。 結果就是:AI 每次回應都在評估一百多條規則,該觸發的 skill 常常漏掉,不該觸發的反而亂觸發。寫程式的時候它想跟我討論交易策略,跑團的時候它想幫我做程式碼審查。 花了幾週迭代,最後整理成一套架構,解決了三個具體問題。今天把它開源了:claude-layers。 問題一:150 個 Skill 全標「必須使用」裝了三四十個 skill 之後,CLAUDE.md 裡的綁定表越來越長。每一條都寫「看到這個關鍵字,必須觸發這個 skill」。 聽起來很合理,直到你發現 AI 把「必須」當成「全部一樣重要」。 實際狀況是:有些 skill 包裝了外部 API(像 Twitter 發推用的 xurl、Google Workspace 用的 gog),不觸發就真的做不了事。但有些 skill 只是品質指引(像 python-patterns 提供 PEP 8...
.npmignore 少一行,512K 行原始碼見光——Claude Code 洩漏事件全解析
2026 年 3 月 31 日 UTC 凌晨 4 點,Anthropic 把 Claude Code v2.1.88 推上 npm。23 分鐘後,一位累積 190 萬美元漏洞賞金的安全研究員在 X 上發了一則貼文,引爆了 AI 開發工具史上最大的原始碼洩漏事件。 512,000 行 TypeScript。1,900 個檔案。44 個未開放的 Feature Flags。全部見光。 而最諷刺的是,這家公司的品牌定位是「安全至上」。 一個 .npmignore 的遺漏如何釀成災難事情的根因簡單到令人難以置信。 Claude Code 用 Bun 做 bundler。Bun 預設會產生 source map 檔案——一個 59.8 MB 的 cli.js.map,用來把打包後的程式碼對應回原始 TypeScript。這個檔案指向 Anthropic 的 Cloudflare R2 儲存桶上一個 zip 壓縮檔,裡面裝著完整的未混淆原始碼。 正常流程下,.npmignore 應該排除這個檔案。但不知道是哪個環節出了問題,它被一起推上了公開的 npm registry。 更慘的是,Bun...
你的 AI 產品準備好被審計了嗎?美國兩部法案正在搶著定義規則
3 月 18 日,美國參議員 Marsha Blackburn 丟出了一份近 300 頁的法案討論稿:TRUMP AMERICA AI Act。幾乎同時,參議員 Edward Markey 推出了 AI Civil Rights Act。 兩部法案都要求對高風險 AI 系統做獨立的第三方偏見審計。但它們對「什麼是偏見」的定義完全不同,對「誰該負責」的看法也截然相反。 如果你的 AI 產品面向美國市場,這不是「未來的問題」。這是現在進行式。 兩部法案在吵什麼TRUMP AMERICA AI Act核心主張:聯邦法統一全國規則,取代各州自己搞的法規拼裝車。 關鍵條款: 風險分級制度:高風險 AI(醫療、信貸、招聘、關鍵基礎設施)需要強制審計和人工監督;低風險 AI 只需要資訊揭露 年度偏見審計:高風險系統必須由獨立第三方做年度審計,特別檢測觀點歧視和政治傾向歧視 廢除 Section 230:AI 公司不再能用「我只是平台」來免責 聯邦搶佔州法:通過後,各州的 AI 法規全部失效,只認聯邦標準 最後一條是最具爭議的。它意味著科羅拉多州、伊利諾州、紐約市這些已經實施的 AI...
