睡覺時讓AI跑100個實驗:Karpathy的autoresearch怎麼用630行程式碼改變ML研究
上週五 Andrej Karpathy 丟了一個新的開源專案到 GitHub,叫 autoresearch。三天內拿了 8,700 顆星。 這個專案做的事情很簡單:給 AI agent 一顆 GPU、一個小型 LLM 訓練環境,讓它自己跑實驗。你睡覺,它工作。醒來時桌上放著 100 個完成的實驗結果。 聽起來像科幻片?630 行 Python 就搞定了。 為什麼這件事值得注意ML 研究有一個眾人皆知但很少人解決的問題:改一個超參數、跑一次訓練、看結果、再改、再跑。這個循環佔了研究者大量時間,而且大部分時間你就是在等 GPU 跑完。 Karpathy 的解法是把這個循環自動化。不是用複雜的 AutoML 框架,不是用分散式訓練叢集,而是用一個極簡的 agent loop: 讀取你寫的 Markdown 指令檔(program.md) 修改訓練程式碼(train.py) 跑 5 分鐘訓練 檢查驗證指標有沒有進步 有 → 保留修改。沒有 → 還原 回到步驟 2 每小時 12 個實驗。一晚大約 100 個。 設計哲學:一個檔案、一顆 GPU、一個指標autoresearch...
