Hypes·3개월 전

Karpathy "8 에이전트 연구 조직" 실험 — 아이디어는 부족하지만 조직을 코드로 짜는 발상

Karpathy 가 nanochat 에서 8개 에이전트(Claude 4, Codex 4)로 연구 조직을 시뮬레이션한 결과를 공유했네요. 각 에이전트가 git 브랜치로 독립 작업하고, tmux 창에 띄워 모니터링하는 구조. 결과는 '아이디어가 형편없음' — 실험 설계를 제대로 못 하고, 큰 모델이 무조건 validation loss 가 낮다는 걸 발견했다며 Karpathy 가 직접 지적해야 했다고. 그래도 핵심은 '연구 조직 자체를 코드로 짠다'는 발상. 프롬프트, 스킬, 도구, 데일리 스탠드업까지 모두 '조직 코드'의 일부로 보고, 임의 태스크에서 얼마나 빠르게 진전을 내는지가 평가 기준이 되는 셈.

#karpathy
#ai-agents
#nanochat
#research-automation

Andrej Karpathy@karpathy

원문 보기 →

Karpathy "8 에이전트 연구 조직" 실험 — 아이디어는 부족하지만 조직을 코드로 짜는 발상

Comments