Papers·2일 전
Ctx2Skill: 멀티에이전트 셀프플레이로 컨텍스트 스킬 자동 추출 — CL-bench 4개 태스크에서 solving rate 향상

Ctx2Skill은 사람의 개입 없이 컨텍스트에서 태스크별 스킬(규칙·절차)을 자동으로 발견·정제·선택하는 프레임워크입니다. Challenger가 문제를 생성하고 Reasoner가 스킬을 활용해 풀며 Judge가 피드백을 주는 멀티에이전트 셀프플레이 루프를 사용하며, 실패 사례를 분석해 스킬을 업데이트합니다. 또한 Cross-time Replay로 과도한 전문화를 방지해 일반화 성능을 확보했습니다. CL-bench의 네 가지 컨텍스트 학습 태스크에서 다양한 백본 모델의 solving rate를 일관되게 개선했습니다.
- #context-learning
- #multi-agent
- #self-play
- #skill-augmentation
- #cl-bench
Shuzheng Si