Meta 的 HyperAgents:AI Agent 開始改進自己的改進方式了
Meta 發了一篇論文叫 HyperAgents,副標題是「Self-referential self-improving agents that can optimize for any computable task」。GitHub 上已經開源,1.6k stars。 讓我把它翻譯成人話:一個 AI agent 不只能改進自己解題的方式,還能改進「自己改進自己」的方式。 聽起來像繞口令。但它指向的方向,值得每個做 AI 應用的開發者留意。 問題:現有的自我改進都卡在一個地方AI agent 的「自我改進」不是新概念。最直觀的版本:agent 跑完一個任務,回頭看看哪裡做得不好,調整策略,下次做得更好。OpenAI 的 o1 用的 self-play、DeepSeek 的 self-improvement、還有去年的 Darwin Gödel Machine(DGM),都是這個思路的變體。 DGM 特別有意思——它能自己修改自己的程式碼,然後測試修改後的版本是否更好。在 coding 領域效果很棒,因為「改善 coding...
