Papers·3개월 전

ClawGym — 개인 AI 에이전트 개발 전주기 지원 프레임워크, 13.5K 합성 태스크와 RL 훈련 파이프라인

ClawGym은 Claw 스타일 개인 에이전트의 데이터 합성, 훈련, 평가를 하나로 묶은 프레임워크입니다. 13.5K 필터링된 합성 태스크(ClawGym-SynData)로 SFT와 경량 RL 파이프라인을 통해 ClawGym-Agent를 훈련했고, 200개 인스턴스로 구성된 벤치마크(ClawGym-Bench)로 평가합니다. 다만 합성 데이터 의존도와 샌드박스 병렬화 인프라가 필요하다는 점은 감안해야 합니다.

#claw-gym
#personal-agent
#data-synthesis
#reinforcement-learning
#benchmark

Fei Bai

원문 보기 →

ClawGym — 개인 AI 에이전트 개발 전주기 지원 프레임워크, 13.5K 합성 태스크와 RL 훈련 파이프라인

Comments