Papers·1개월 전

MetaAgent-X: 엔드투엔드 RL로 자동 MAS 설계와 실행을 동시 최적화 — 최대 21.7% 성능 향상

Oregon State University 연구팀이 자동 다중 에이전트 시스템(MAS)의 설계자(designer)와 실행자(executor)를 엔드투엔드 강화학습으로 공동 최적화하는 MetaAgent-X를 제안했습니다. 기존 접근법은 테스트 시 검색이나 메타 설계자만 최적화해 실행자는 고정된 채로 두는 한계가 있었는데, MetaAgent-X는 계층적 롤아웃과 단계적 공진화(Stagewise Co-evolution)를 도입해 두 역할을 함께 학습시킵니다. 다양한 자동 MAS 벤치마크에서 최대 21.7% 성능 향상을 보였으며, 설계자와 실행자가 모두 학습 과정에서 개선됨을 확인했습니다. 다만 8×A100 환경 기준 실험 결과로, 단일 GPU 환경에서의 확장성은 추가 검증이 필요합니다.

#multi-agent-systems
#reinforcement-learning
#meta-agent-x
#oregon-state-university

Oregon State University

원문 보기 →

MetaAgent-X: 엔드투엔드 RL로 자동 MAS 설계와 실행을 동시 최적화 — 최대 21.7% 성능 향상

Comments