Papers·2개월 전

NoisyAgent — 환경 잡음에 강한 LLM 에이전트 학습 프레임워크

LongCat 팀이 LLM 에이전트가 실제 환경에서 성능 저하를 겪는 문제를 해결하기 위해 NoisyAgent 프레임워크를 제안했습니다. 사용자 잡음(명령어 모호성)과 도구 잡음(실행 실패)을 훈련 과정에 점진적으로 도입하여 에이전트의 강건성을 높였으며, 잡음 환경에서 훈련된 모델이 이상적 벤치마크에서도 성능 향상을 보였다는 점이 흥미롭습니다. 단, 실험 환경이 시뮬레이션 기반이라는 한계가 있습니다.

LongCat 팀이 실제 환경의 불완전성에 강건한 LLM 에이전트 학습 프레임워크 NoisyAgent를 공개했습니다.

핵심 결론

태스크 — LLM 에이전트의 실제 환경 강건성 개선 — 사용자 잡음과 도구 잡음에 대응.
결과 — 잡음 환경 벤치마크에서 일관된 성능 향상, 이상적 벤치마크에서도 추가 이득 관찰.

방법

잡음 유형 — 사용자 잡음(명령어 변형, 모호성)과 도구 잡음(실행 실패, 지연)을 식별.
훈련 전략 — 잡음을 rollout 일부에만 적용하고, 모델 적응에 따라 점진적으로 난이도 증가.
시뮬레이션 기반으로 잡음 패턴을 생성하여 훈련 파이프라인에 통합했습니다.

한계·조건

환경 — 실험이 시뮬레이션 환경에서 수행되어 실제 배포 시 추가 검증 필요.
코드 — 현재 코드 공개 여부 미정 — abstract만 공개 중.

편집자 한 줄

잡음 강도를 점진적으로 높이는 커리큘럼 전략이 단순하면서도 효과적으로 보입니다.

#llm-agents
#robustness
#noise
#training-framework
#longcat

LongCat

원문 보기 →

NoisyAgent — 환경 잡음에 강한 LLM 에이전트 학습 프레임워크

핵심 결론

방법

한계·조건

Comments