Papers·3일 전
EVOCHAMBER — 다중 에이전트 테스트타임 진화, 수학 63.9%·코드 75.7%·추론 87.1%
EVOCHAMBER는 훈련 없이 다중 에이전트 집단의 협력 구조와 지식 흐름을 진화시키는 프레임워크입니다. 핵심은 CODREAM 프로토콜로, 팀 실패 시 강한 에이전트가 약한 에이전트에게 비대칭적으로 통찰을 전달해 전문화를 유지하면서 지식 격차를 메웁니다. Qwen3-8B 기반 세 가지 이기종 태스크에서 수학 63.9%, 코드 75.7%, 다중 도메인 추론 87.1%를 기록했으며, 비대칭 교차 에이전트 전이가 주요 성능 요인임을 ablation으로 확인했습니다. 단, 8B 모델 기준이며 더 큰 모델에서의 확장성은 추가 검증이 필요합니다.
- #multi-agent
- #test-time-evolution
- #emergent-specialization
- #qwen
- #collaborative-dreaming
Yaolun Zhang