Papers·1주 전
Skills-Coach: LLM 에이전트 스킬 자가진화 프레임워크 — 48개 스킬 벤치마크에서 성능 개선

Skills-Coach는 LLM 기반 에이전트의 스킬을 자가진화시키는 프레임워크로, 48개 스킬로 구성된 Skill-X 벤치마크에서 전반적인 성능 향상을 보였습니다. 네 가지 모듈(다양한 태스크 생성, 경량 최적화, 비교 실행, 추적 평가)을 통해 스킬 프롬프트와 코드를 자동으로 개선하며, 가상 모드와 실제 모드를 지원합니다. 단, 실험 환경이나 구체적인 개선 수치가 논문에 명시되지 않아 재현성 확인이 필요합니다.
- #llm-agents
- #skill-evolution
- #benchmark
- #huggingface
Yu Tian