kyosora 筆記

睡覺時讓AI跑100個實驗：Karpathy的autoresearch怎麼用630行程式碼改變ML研究

發表於2026-03-10|AI工具實戰

上週五 Andrej Karpathy 丟了一個新的開源專案到 GitHub，叫 autoresearch。三天內拿了 8,700 顆星。這個專案做的事情很簡單：給 AI agent 一顆 GPU、一個小型 LLM 訓練環境，讓它自己跑實驗。你睡覺，它工作。醒來時桌上放著 100 個完成的實驗結果。聽起來像科幻片？630 行 Python 就搞定了。為什麼這件事值得注意ML 研究有一個眾人皆知但很少人解決的問題：改一個超參數、跑一次訓練、看結果、再改、再跑。這個循環佔了研究者大量時間，而且大部分時間你就是在等 GPU 跑完。 Karpathy 的解法是把這個循環自動化。不是用複雜的 AutoML 框架，不是用分散式訓練叢集，而是用一個極簡的 agent loop：讀取你寫的 Markdown 指令檔（program.md）修改訓練程式碼（train.py）跑 5 分鐘訓練檢查驗證指標有沒有進步有 → 保留修改。沒有 → 還原回到步驟 2 每小時 12 個實驗。一晚大約 100 個。設計哲學：一個檔案、一顆 GPU、一個指標autoresearch 最吸引我...