Papers·1주 전
Solvita: 에이전트 진화 프레임워크로 경쟁 프로그래밍 정확도 2배 향상

NJU-LINK Lab이 제안한 Solvita는 LLM 가중치 업데이트 없이 에이전트가 경험을 축적하며 지속적으로 학습하는 프레임워크입니다. Planner, Solver, Oracle, Hacker 네 에이전트가 각각 그래프 구조의 지식 네트워크를 통해 RL 업데이트를 수행하며, CodeContests, APPS, AetherCode, 라이브 Codeforces에서 기존 멀티에이전트 파이프라인 대비 최고 성능을 기록하고 단일 패스 대비 정확도를 거의 두 배로 높였습니다. 다만 각 에이전트의 지식 네트워크 학습에 추가 연산이 필요하다는 점은 한계입니다.
- #llm
- #multi-agent
- #reinforcement-learning
- #code-generation
- #competitive-programming
NJU-LINK Lab