AI Agent 越記越笨:一篇 Illinois 論文打臉所有「個人 AI 記憶」熱潮
幾個月前我停用了 claude-mem,理由很單純:MCP 每次互動都打一次 round-trip,對話被它拖到肉眼可見的慢。當時的決定純屬效能直覺,跟「記憶品質」沒關係——我預設「記得多總是好事」。 上週 X 上開始刷一篇 UIUC 的 Dylan Zhang 等人的論文〈Useful Memories Become Faulty When Continuously Updated by LLMs〉(arXiv:2605.12978)。論文做了一個我看到結果愣了五秒的實驗:把 GPT-5.4 原本 100% 解得出來的 ARC-AGI 問題,丟進「持續記憶」的迴圈讓它一邊解一邊累積經驗——最後 54% 的題目反而解不出來了(注意:54% 是失敗率,不是剩餘準確率,原本 100% 變成只剩 46% 能解)。 那一刻我反應過來,當初停用 claude-mem 那個直覺,可能比我想的還更對。 論文在做什麼論文針對的是一個被很多主動寫入式記憶工具共用的設計誘惑——consolidation loop,三句話: 12345distill experience ...
