← Back to feed
Papers·2일 전

UC Berkeley, 놀이를 통해 스킬을 학습하는 로봇 에이전트 RATs — LIBERO-PRO 20.6%p 향상

UC Berkeley, 놀이를 통해 스킬을 학습하는 로봇 에이전트 RATs — LIBERO-PRO 20.6%p 향상

UC Berkeley 팀이 놀이(play)를 통해 코드 기반 스킬을 사전 학습하는 로봇 에이전트 RATs를 제안했습니다. RATs는 자발적으로 탐색 과제를 생성하고, 실행하며, 실패 시 피드백을 통해 스킬 라이브러리를 구축합니다. LIBERO-PRO와 MolmoSpaces에서 각각 20.6, 17.0%p의 성능 향상을 보였고, 학습된 스킬은 파인튜닝 없이 다른 에이전트에 이식 가능합니다.

UC Berkeley 연구진이 로봇이 놀이를 통해 스스로 스킬을 학습하는 프레임워크 RATs를 공개했습니다.

핵심 결론

  • 성능LIBERO-PRO에서 CaP-Agent0 대비 20.6%p, MolmoSpaces에서 17.0%p 향상.
  • 전이학습된 스킬 라이브러리를 다른 Code-as-Policy 에이전트에 컨텍스트로 주입만 해도 RoboSuite 8.9%p, 실제 환경 8.8%p 개선.

방법

  • 놀이 단계RATs는 스스로 탐색 과제를 제안하고, 코드 정책을 계획·실행하며, 중간 진행을 검증하고, 실패 시 단계별 피드백으로 재시도 후 성공한 실행을 코드 스킬 라이브러리로 저장.
  • 테스트 시에는 이 라이브러리에서 관련 스킬을 검색해 새 과제 해결에 활용합니다.

한계·조건

  • 환경실험은 시뮬레이터(LIBERO-PRO, MolmoSpaces)와 제한된 실제 환경에서 수행.
  • 코드코드 공개 여부는 아직 명시되지 않았습니다.

편집자 한 줄

놀이를 통한 스킬 학습 아이디어는 직관적이면서도 효과적이네요. 다만 스킬 라이브러리의 확장성과 장기 유지보수 측면은 추가 검증이 필요해 보입니다.

  • #robotics
  • #code-as-policy
  • #skill-learning
  • #uc-berkeley
UC Berkeley
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —