← Back to feed
Papers·2일 전

Michigan, 장기 로봇 조작 실패 탐지 프레임워크 Foresight — LIBERO-Long 등에서 92% 정확도

Michigan, 장기 로봇 조작 실패 탐지 프레임워크 Foresight — LIBERO-Long 등에서 92% 정확도

University of Michigan 팀이 장기 로봇 조작 태스크에서 실패를 탐지하는 프레임워크 Foresight를 제안했습니다. action-conditioned world model의 잠재 표현을 활용하여 최종 성공/실패 레이블만으로 훈련되며, conformal prediction으로 임계값을 적응적으로 조정합니다. LIBERO-Long, ManiSkill-Long, BEHAVIOR-1K 시뮬레이션과 실제 로봇(ReactorX-200, Franka)에서 기존 방법 대비 평균 12% 향상된 탐지 정확도를 보였습니다. 단, world model 훈련에 추가 계산 비용이 필요하며, 태스크 길이가 매우 긴 경우 일반화 검증이 더 필요합니다.

Michigan 팀이 장기 로봇 조작에서 실패를 탐지하는 Foresight 프레임워크를 공개했습니다.

핵심 결론

  • 태스크장기 로봇 조작 실패 탐지 — LIBERO-Long, ManiSkill-Long, BEHAVIOR-1K 시뮬레이션과 실제 로봇 4개 태스크에서 평가.
  • 성능기존 실패 탐지 방법 대비 평균 정확도 12% 향상, F1 점수 0.89 달성.
  • 적용다양한 정책(VLA, diffusion policy 등)에 통합 가능한 unified 프레임워크.

방법

  • 핵심 아이디어action-conditioned world model의 latent embedding을 실패 탐지 특징으로 사용.
  • 훈련최종 태스크 성공/실패 레이블만 필요 — dense temporal annotation 불필요.
  • Functional conformal prediction(FCP)으로 탐지 임계값을 adaptively calibration.

한계·조건

  • 계산 비용world model 훈련에 추가 GPU 시간 필요 — 실험은 4x A100 기준.
  • 일반화매우 긴 태스크(1000+ step)에서의 성능은 추가 검증 필요.
  • 코드GitHub 공개 예정 — 현재는 논문 및 부록만 공개.

편집자 한 줄

실패 탐지에 world model latent를 쓰는 아이디어 자체는 간단하지만, conformal prediction으로 threshold를 자동 조정하는 점이 실용적입니다.

  • #failure-detection
  • #robotics
  • #world-model
  • #long-horizon
  • #michigan
University of Michigan
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —