← Back to feed
Papers·1주 전

MetaAgent-X: 엔드투엔드 RL로 자동 MAS 설계와 실행을 동시 최적화 — 최대 21.7% 성능 향상

MetaAgent-X: 엔드투엔드 RL로 자동 MAS 설계와 실행을 동시 최적화 — 최대 21.7% 성능 향상

Oregon State University 연구팀이 자동 다중 에이전트 시스템(MAS)의 설계자(designer)와 실행자(executor)를 엔드투엔드 강화학습으로 공동 최적화하는 MetaAgent-X를 제안했습니다. 기존 접근법은 테스트 시 검색이나 메타 설계자만 최적화해 실행자는 고정된 채로 두는 한계가 있었는데, MetaAgent-X는 계층적 롤아웃과 단계적 공진화(Stagewise Co-evolution)를 도입해 두 역할을 함께 학습시킵니다. 다양한 자동 MAS 벤치마크에서 최대 21.7% 성능 향상을 보였으며, 설계자와 실행자가 모두 학습 과정에서 개선됨을 확인했습니다. 다만 8×A100 환경 기준 실험 결과로, 단일 GPU 환경에서의 확장성은 추가 검증이 필요합니다.

  • #multi-agent-systems
  • #reinforcement-learning
  • #meta-agent-x
  • #oregon-state-university
Oregon State University

Comments

— 첫 댓글을 남겨보세요 —