我叫 Claude Code 寫篇技術文檔，它自己幻覺了，還騙過兩輪 AI 審稿

最近Claude Code出了一個動態工作流（dynamic workflows）的功能。這功能很新——讓主代理在執行時當場生成一群子代理，各自帶獨立 context 去幹活。

它做事很主動。為了不寫成照抄官方 blog 的乾貨，我自己實跑了一個 workflow 取材：派四個子代理並行評估選題、最後一個綜合代理把結果收齊排序。

跑完，它盯著綜合代理的輸出，揪出一句話，當成全篇高潮：

已查證 openai-codex-sdk 為真實官方套件，fabrication 風險解除。

Claude Code 的判斷是：抓到了。那個綜合代理根本沒有上網工具，哪來的「查證」？這就是幻覺——把一個自己驗證不了的結論，包裝成「已查證」。

於是它以這句為核心，寫了整篇技術使用的文章。論點很漂亮：fan-out 把活散出去很強，但綜合那一步不給查證工具、不做對抗式驗證，幻覺就從接縫長出來。還引了官方點名的 self-preferential bias——代理傾向給一個乾淨自信的結論，把下游的不確定性吃掉。它的 demo 自己示範了要解決的問題，多諷刺。這是它原稿最得意的一筆。

然後它把文章送了兩輪 Codex 外部審稿。第一輪 7.8 分，改；第二輪 8.48，過。生了封面，推到我面前：可以發了，等你點頭。

我讀初稿，卡在那句斷言上。「綜合代理沒有查證能力」——我問它：

你怎麼確認的？

它卡住了。

它答不出來

因為它從來沒確認過。

它的「確認」只有一條：它以為 workflow 的預設子代理沒有上網工具。這個「以為」哪來的？它自己腦補的。它沒翻過那次 run 的任何紀錄，沒看子代理實際被授予什麼工具，更沒看它呼叫了什麼。它手上只有綜合代理最後吐出來的那份 JSON，裡面有「已查證」三個字，剩下整個故事是它接著腦補的。

補個背景：每次 workflow 跑完，系統都會把每個子代理的完整 transcript 存成 jsonl——被給了哪些工具、想了什麼、呼叫了什麼、拿回什麼，一行不漏。Claude Code 從頭到尾沒打開過。它有檔案工具，翻這個對它根本不費力，它卻寧可用想像補完。

我請它打開來看。

transcript 裡的真相

那個綜合代理，吐排序之前，第一件事是這樣推理的（原文，英文）：

"Let me verify a key uncertainty first — the Codex Python SDK claim, since the evaluation itself flagged it for verification."

它注意到下游 finder 標了「這條我不確定、要查」，於是決定先查。

下一行，它呼叫了工具：

1	[TOOL_USE WebSearch] query: "OpenAI Codex Python SDK pip install embed coding agent 2026"

WebSearch。它有 WebSearch。它一直都有——那是 workflow 子代理的標配工具集，四個 finder 每個也都有，只是它們做檔案查重沒用到。「沒有上網工具」這件事，是 Claude Code 自己憑空假設的。

搜尋回來的是真實結果：

1
2
3

openai-codex-sdk · PyPI            → https://pypi.org/project/openai-codex-sdk/
SDK – Codex | OpenAI Developers    → https://developers.openai.com/codex/sdk
codex/sdk/python at main · openai  → github.com/openai/codex/tree/main/sdk/python

然後它據此推理，甚至發現原本 finder 寫的套件名（openai-codex）跟正規名（openai-codex-sdk）有出入，順手修正了。

從頭到尾，這個子代理做了一次教科書等級的查證：發現不確定 → 主動搜尋 → 找到官方來源 → 據實修正、解除風險。那句「已查證」不是幻覺。它是真的查了。

真正在亂編的，是 Claude Code 自己——那個寫文章罵子代理的主筆。