Papers·4일 전
MASA: 모델 인식 스킬 정렬 프레임워크 — 스킬 효과는 백본에 따라 달라, 최대 25.8점 향상

LLM 에이전트가 외부 스킬 라이브러리를 활용할 때, 동일한 스킬이 백본 모델에 따라 효과가 크게 달라진다는 점을 발견하고 이를 해결하는 MASA(Model-Aware Skill Alignment) 프레임워크를 제안했습니다. MASA는 계층적 스킬 진화 파이프라인(hill climbing + UCB 트리 탐색)으로 각 백본에 맞게 스킬을 재작성하고, 경량 모델-조건부 스킬 리라이터로 단일 forward pass에 적응을 수행합니다. 세 가지 인터랙티브 환경과 네 가지 백본 실험에서 최대 25.8점 향상을 보였으며, 학습된 리라이터는 추가 탐색 없이 미지의 태스크와 환경으로 일반화됩니다.
LLM 에이전트가 외부 스킬 라이브러리를 쓸 때, 같은 스킬이라도 백본 모델에 따라 효과가 천차만별이라는 점을 실험으로 밝히고, 이를 해결하는 MASA 프레임워크를 제안했습니다.
핵심 결론
- 발견 — 스킬 효과는 모델 의존적: 어떤 스킬은 한 백본에 도움을 주지만 다른 백본에는 성능을 떨어뜨림.
- 성능 — MASA는 세 가지 환경과 네 가지 백본에서 최대 25.8점 향상 (강력한 베이스라인 대비).
- 일반화 — 학습된 리라이터는 추가 탐색 없이 미지의 태스크와 환경에서도 큰 LLM을 능가.
방법
- 1단계 — 계층적 스킬 진화: hill climbing과 UCB 기반 트리 탐색으로 일반 스킬과 태스크별 스킬을 반복 재작성. 환경 피드백과 모델 능력 프로파일을 가이드로 사용.
- 2단계 — 경량 모델-조건부 스킬 리라이터: 진화 궤적을 학습하여 단일 forward pass로 적응을 재현. 큰 LLM보다 훨씬 저렴한 추론 비용.
- 특징 — 에이전트 가중치를 수정하지 않고 스킬만 조정하므로 기존 파이프라인에 쉽게 통합 가능.
한계·조건
- 환경 — 세 가지 인터랙티브 환경(ALFWorld, WebShop, ScienceWorld)에서 검증. 더 다양한 도메인에서 추가 검증 필요.
- 백본 — 네 가지 백본(크기와 종류 다양)으로 실험했지만, 더 큰 스케일에서의 일반화는 추가 확인이 필요.
- 코드 — 논문에는 코드 공개 여부가 명시되지 않음.
편집자 한 줄
스킬 라이브러리를 '모델-불변'으로 취급하던 기존 관행에 반박하는 점이 흥미롭습니다. 리라이터를 한 번 학습해두면 다양한 백본에 빠르게 적용할 수 있어 실용성도 높아 보입니다.
- #llm-agent
- #skill-library
- #model-adaptation
- #michigan-state-university
Jianxiang Yu