Papers·1개월 전

SkillAdaptor: 단계별 실패 귀인으로 훈련 없는 스킬 적응 — WebShop 성공률 +1.7p

Ant Group 팀이 LLM 에이전트의 외부 스킬을 훈련 없이 단계별로 적응시키는 SkillAdaptor 프레임워크를 제안했습니다. 기존 파이프라인은 전체 궤적이나 세션 피드백으로 실패 원인을 추정해 수정이 불안정했는데, SkillAdaptor는 첫 번째 실행 가능한 실패 단계를 식별하고 해당 스킬에 책임을 연결해 타겟 업데이트를 수행합니다. WebShop, PinchBench, Claw-Eval에서 Kimi-K2.5, GLM-5, GPT-5.2로 평가한 결과, 모든 벤치마크에서 스킬 없음 및 기존 스킬 적응 대비 개선되었으며 최대 +1.8점 향상되었습니다. 코드는 공개 예정입니다.

Ant Group이 LLM 에이전트의 외부 스킬을 훈련 없이 단계별로 적응시키는 SkillAdaptor를 공개했습니다.

핵심 결론

벤치 — WebShop 성공률 +1.7p, PinchBench Avg Score% +1.5p, Claw-Eval Avg Score +1.8p — 모두 기존 스킬 적응 대비 개선.
모델 — Kimi-K2.5, GLM-5, GPT-5.2 세 모델에서 일관된 향상, 모델에 둔감한 점이 특이합니다.

방법

단계별 귀인 — 실패 궤적에서 첫 번째 실행 가능한 오류 단계를 찾고, 해당 단계의 책임을 특정 스킬에 연결합니다.
기존 파이프라인은 전체 궤적이나 세션 피드백으로 실패 원인을 추정해 수정이 불안정했는데, SkillAdaptor는 단계 단위로 좁혀 안정성을 높인 셈입니다.
훈련 불필요 — 백본 모델은 고정하고 스킬만 타겟 업데이트하므로 추가 학습 비용이 없습니다.

한계·조건

환경 — OpenClaw-class 에이전트 하네스에 플러그인 형태로, 특정 아키텍처에 종속적일 수 있습니다.
코드 — GitHub 공개 예정 — 현재는 논문 내 결과만 확인 가능.

편집자 한 줄

단계별 귀인이라는 아이디어는 간단하지만, 실제로 여러 벤치에서 일관된 향상을 보인 점이 인상적입니다. 다만 실패 단위가 명확한 환경에 특화되어 있어 일반 대화 에이전트로의 확장은 추가 검증이 필요해 보입니다.

#llm-agents
#skill-adaptation
#failure-attribution
#ant-group

Ant Group

원문 보기 →

SkillAdaptor: 단계별 실패 귀인으로 훈련 없는 스킬 적응 — WebShop 성공률 +1.7p

핵심 결론

방법

한계·조건

Comments