Papers·2일 전
SkillAdaptor: 단계별 실패 귀인으로 훈련 없는 스킬 적응 — WebShop 성공률 +1.7p

Ant Group 팀이 LLM 에이전트의 외부 스킬을 훈련 없이 단계별로 적응시키는 SkillAdaptor 프레임워크를 제안했습니다. 기존 파이프라인은 전체 궤적이나 세션 피드백으로 실패 원인을 추정해 수정이 불안정했는데, SkillAdaptor는 첫 번째 실행 가능한 실패 단계를 식별하고 해당 스킬에 책임을 연결해 타겟 업데이트를 수행합니다. WebShop, PinchBench, Claw-Eval에서 Kimi-K2.5, GLM-5, GPT-5.2로 평가한 결과, 모든 벤치마크에서 스킬 없음 및 기존 스킬 적응 대비 개선되었으며 최대 +1.8점 향상되었습니다. 코드는 공개 예정입니다.
Ant Group이 LLM 에이전트의 외부 스킬을 훈련 없이 단계별로 적응시키는 SkillAdaptor를 공개했습니다.
핵심 결론
- 벤치 — WebShop 성공률 +1.7p, PinchBench Avg Score% +1.5p, Claw-Eval Avg Score +1.8p — 모두 기존 스킬 적응 대비 개선.
- 모델 — Kimi-K2.5, GLM-5, GPT-5.2 세 모델에서 일관된 향상, 모델에 둔감한 점이 특이합니다.
방법
- 단계별 귀인 — 실패 궤적에서 첫 번째 실행 가능한 오류 단계를 찾고, 해당 단계의 책임을 특정 스킬에 연결합니다.
- 기존 파이프라인은 전체 궤적이나 세션 피드백으로 실패 원인을 추정해 수정이 불안정했는데, SkillAdaptor는 단계 단위로 좁혀 안정성을 높인 셈입니다.
- 훈련 불필요 — 백본 모델은 고정하고 스킬만 타겟 업데이트하므로 추가 학습 비용이 없습니다.
한계·조건
- 환경 — OpenClaw-class 에이전트 하네스에 플러그인 형태로, 특정 아키텍처에 종속적일 수 있습니다.
- 코드 — GitHub 공개 예정 — 현재는 논문 내 결과만 확인 가능.
편집자 한 줄
단계별 귀인이라는 아이디어는 간단하지만, 실제로 여러 벤치에서 일관된 향상을 보인 점이 인상적입니다. 다만 실패 단위가 명확한 환경에 특화되어 있어 일반 대화 에이전트로의 확장은 추가 검증이 필요해 보입니다.
- #llm-agents
- #skill-adaptation
- #failure-attribution
- #ant-group
Ant Group