← Back to feed
Papers·어제

SLIM: 동적 스킬 생애주기 관리로 에이전트 RL 성능 7.1%p 향상

SLIM: 동적 스킬 생애주기 관리로 에이전트 RL 성능 7.1%p 향상

홍콩중문대 연구팀이 에이전트 RL에서 외부 스킬 세트를 동적으로 최적화하는 프레임워크 SLIM을 제안했습니다. 기존 연구는 스킬이 영구적으로 축적되거나 정책에 내재화된다고 가정했지만, SLIM은 leave-one-skill-out 검증으로 각 스킬의 한계 기여도를 측정해 유지·퇴직·확장 세 가지 생애주기 연산을 적용합니다. ALFWorld와 SearchQA에서 최대 7.1%p 향상되었으며, 일부 스킬은 정책에 흡수되고 일부는 외부 가치를 계속 제공하는 혼합 패턴을 보였습니다. 단, 실험 환경이 제한적이고 스킬 단위의 정의에 따라 결과가 달라질 가능성이 있습니다.

The Chinese University of Hong Kong - Database Group

Comments

— 첫 댓글을 남겨보세요 —