Papers·1개월 전

Princeton, 포켓몬 게임 완벽 클리어한 AI 에이전트 — Continual Harness 로 인간 개입 제거

Princeton 연구팀이 발표한 Continual Harness는 인간의 개입 없이도 포켓몬 게임을 처음부터 끝까지 클리어할 수 있는 자기 개선형 에이전트 프레임워크입니다. 기존 Gemini Plays Pokemon(GPP) 실험에서 인간이 반복적으로 프롬프트를 수정해 포켓몬 블루, 옐로우 레전드, 크리스탈을 클리어한 경험을 바탕으로, 이 과정을 자동화해 에이전트가 스스로 프롬프트, 서브 에이전트, 스킬, 메모리를 개선하도록 했습니다. 프론티어 모델을 사용해 포켓몬 레드와 에메랄드에서 버튼 누름 횟수를 크게 줄였고, 수작업으로 만든 전문가 수준의 성능에 근접했습니다. 단, 성능 향상은 모델의 기본 능력에 의존적이며, 환경 재설정 없이 지속적인 학습이 가능하다는 점이 특징입니다.

#embodied-agents
#self-improvement
#pokemon
#princeton

Princeton University

원문 보기 →

Princeton, 포켓몬 게임 완벽 클리어한 AI 에이전트 — Continual Harness 로 인간 개입 제거

Comments