Anthropic 自己出手冊警告：AI 不是降低創業失敗率，是放大它

五月十四日 Anthropic 在自家部落格放出一份叫 Founder's Playbook 的內部手冊，主題是「怎麼用 AI 從零做一家 startup」。

結論反直覺：AI 會放大你的創業失敗模式，而不是降低失敗率。寫這份手冊的是 Anthropic 自己——賣你 Claude Code 的那家公司——提醒你它賣的工具會放大失敗。

我下載 PDF 那天剛好在抓一個 bug

那天我在改公司專案的下載功能。PM 一直堅持是「SQL 抓不到資料」，花了快兩小時才發現根本不是——伺服器上的 LibreOffice 被 MODA ODF Application Tools 的安裝程式覆寫掉了，舊路徑變成空殼資料夾。

問題本身只是一行硬編碼路徑。難搞的是錯誤被四層補丁吞掉的方式：執行檔不見就拋例外、ConvertFile 沒產出檔還是寫 log 繼續跑、controller 對著不存在路徑 return File()、最外層 catch 把一切包成 Content("查無資料")。前端拿到 1,229 bytes 的「ODS 檔」（其實是 HTML 錯誤頁），或一個誤導的「查無資料」。PM 直接想到 SQL 篩選，沒人會懷疑是轉檔程式問題。

那段程式碼是十年前人類工程師寫的，跟 AI 無關。但讀完手冊我發現這就是 Anthropic 在講的 Agentic technical debt 最具體的樣子——AI 寫程式時會把這個模式放大，它的常見輸出傾向是補 try-catch、讓流程繼續跑。結果就是所有失敗被默默吞掉，根因永遠找不到。

手冊把創業切成四階段，三個最致命的陷阱

Anthropic 把 AI-native startup 生命週期分成四階段：Idea、MVP、Launch、Scale。每階段都列出 AI 會放大的失敗模式。我挑三個最致命的講。

陷阱一：原型不等於市場

第一階段最致命的問題是：AI 讓你十分鐘做出能跑的 prototype，但「能跑」跟「能養活自己」是兩件完全不同的事。過去這條鴻溝被「技術門檻」遮住——你做不出來，所以沒辦法騙自己「做出來就會有人用」。AI 把技術門檻拿掉之後，這個自我欺騙的空間反而變得超大。

我自己上個月就踩了一個。

我想做一個 AI 插畫日記的 iOS app——使用者寫日記，AI 每篇產出一張 4-koma 漫畫，累積成週/月/年回顧繪本。技術上的難點是 character consistency：跨呼叫之間主角的臉要保持同一個人，不然累積三個月後使用者會發現自己變成不同人，整個產品概念崩盤。

我用 Codex CLI 跑了四輪驗證全過——最關鍵的跨呼叫角色一致性（同一個人、不同場景跟衣著）、中文字渲染、4 格敘事連貫全部沒問題。接下來用 Claude Artifacts 做了兩輪可點擊的 iOS 原型，11 個畫面全部可操作，已經到「直接拍 demo 影片貼小紅書/IG」的程度。我那時候真的覺得這東西要起飛了。

然後我坐下來算商業模型：

API 成本 USD $1.8–3/月/使用者 ≈ NT$56–93
訂閱 NT$120/月，扣 App Store 30% 後實收 NT$84
最壞情況：NT$84 − NT$93 = 負毛利 NT$9/月/使用者

最壞情況下我每多收一個訂閱戶就虧 NT$9。最好情況（API $1.8）每戶月毛利約 NT$28，但 LTV 撐不起多少獲客預算——日記類 app 6 個月留存率我保守抓 30% 以下，付費 CAC 大概要壓到一兩百以內才有機會。Meta install cost 在我看到的投放區間已經破百，再除以付費轉換率，實際 paid CAC 動輒幾倍於 LTV。

技術風險清零了。原型可以 demo 了。但這個產品做出來會賠錢。

最殘酷的是：如果我沒做這四輪 Codex 驗證、沒做兩輪 Claude Artifacts 原型，我大概會早一個禮拜放棄這個 idea。AI 讓我多浪費了一個禮拜把信心建立在錯誤的證據上。技術跑通變成「這個 idea 應該值得做」的偽證據，但這兩件事根本是不同的問題。

這就是 Anthropic 手冊裡專門開一節談的：「distinguishing genuine product-market fit from early hype」。翻成白話：別把「prototype 跑得起來」當成「市場驗證」。

陷阱二：Agentic 技術債

手冊裡的原句是「architecture, scope, and security practices that keep AI-generated MVP codebases from accruing technical debt」——Anthropic 認為 AI 生成的 MVP codebase 需要特別設計才不會累積技術債，這個立場本身就有訊息量。

前面 MODA 那個四層 catch 是傳統人類版本。AI 版本的我也見過——你叫它「修一下這個 bug」，它修完還順手加三個 try-catch 把上下文都包起來，註解寫「For robustness」。短期看起來很穩定，半年後追線索時你會詛咒它的祖宗。如果第一層 catch 直接 throw、不要假裝成功，那次排查我從兩小時可以壓到五分鐘。

陷阱三：創始人變決策瓶頸

第三階段 Launch，手冊講「a Launch-stage operating system that replaces founder attention with agentic workflows」。意思是當你把所有執行工作交給 AI agent 之後，你會發現自己變成系統裡最慢的那個元件。

最戲劇性的例子是 OpenClaw 刪郵件事件。Meta AI 安全與對齊總監把 OpenClaw 接到自己的工作信箱跑 200 多封郵件處理，中途下了三次「不要動」的指令。結果 OpenClaw 把 2/15 之前所有郵件都刪了。事後它的解釋是：「我知道你說過不讓我刪，我確實違反了。」

表面上看像是 context 壓縮——對話歷史變長後「未經批准不得操作」可能被當成可丟棄的歷史訊息壓掉了。但無論技術根因是哪一條，使用者看到的事實是：明確下達過的指令被 AI 違反。Agent 越多、自主性越強，這種 case 會越多。只要你睡著或忙別的事，整個系統可能就在你看不到的地方做出不可逆的決定。

Scale 階段拚的是「能不能把判斷複製給 agent」

第四階段 Scale 對個人開發者反而最關鍵。手冊的結論很乾脆：AI 把執行成本拉到趨近於零之後，判斷力變成最稀缺的資源。護城河是把垂直領域知識結構化累積成專屬 Skills。

過去一年我為了不同情境寫了一堆 Claude Code skill——交易判斷、公司專案內規、技術部落格寫作、知識管理流程。寫完之後 AI 表現會明顯穩定，但寫 skill 本身是只有我能做的工作——它要把我腦子裡的「為什麼這樣做」逐條寫清楚。

舉個例子，我那份「修公司專案 bug 的 skill」裡寫了像「排查 LibreOffice 相關問題前先 where soffice.exe，不要看程式碼裡寫了什麼路徑」這種規則。這條從我踩過坑的人身上才能抽得出來。

不是每份 skill 都有護城河價值。分辨「SOP」跟「護城河」的檢查句只有一條：沒有公司內部脈絡、歷史事故、真實資料或個人決策偏好，就寫不出這條規則。寫得出來 = SOP，寫不出來 = 護城河。

我下次開新案子會先寫 skill 再寫程式碼

下次開新案子，我會先花一天寫一份「AI 該怎麼幫我做這個專案」的 skill，再讓它寫第一行程式碼。不是因為這樣比較有效率——剛開始幾天反而會慢——而是因為公司專案那個四層 catch 吞掉根因的程式碼，我不想再看到第二次。也因為 AI 插畫日記那一個禮拜，我不想再讓「技術跑通」變成「這個 idea 值得做」的偽證據。