← Back to feed
Papers·3일 전

Hide-and-Seek: VLA 로봇 실패 탐지를 궤적 레이블만으로 — LIBERO·VLABench·실물 로봇에서 SOTA

Hide-and-Seek: VLA 로봇 실패 탐지를 궤적 레이블만으로 — LIBERO·VLABench·실물 로봇에서 SOTA

위스콘신 대학교 매디슨 팀이 VLA 모델의 실행 실패를 탐지하는 Hide-and-Seek 프레임워크를 제안했습니다. 궤적 단위 레이블만으로 단계별 주석 없이도 실패 지점을 국소화하며, LIBERO·VLABench·실물 로봇에서 OpenVLA·π_0·π_{0.5} 정책을 평가해 conformal prediction 기반 정확도-적시성 트레이드오프에서 SOTA를 달성했습니다. 다만 궤적 내 대비 학습이 추가 연산을 요구해 실시간성에 제약이 있을 수 있습니다.

로봇 VLA 모델의 실행 실패를 궤적 레이블만으로 탐지하는 프레임워크 — 단계별 주석 없이도 실패 지점을 찾아냅니다.

핵심 결론

  • 태스크VLA 정책의 실행 실패 탐지 — 궤적 단위 레이블만으로 단계별 실패 신호를 학습.
  • 성능LIBERO, VLABench, 실물 로봇에서 OpenVLA·π_0·π_{0.5} 정책 평가, conformal prediction 기반 정확도-적시성 트레이드오프 SOTA.
  • 일반화보지 못한 태스크에서도 성능 유지 — 실패 패턴이 태스크 간 공유됨을 시사.

방법

  • 핵심 아이디어궤적 내(intra-trajectory)와 궤적 간(inter-trajectory) 대비 학습을 결합해, 궤적 레이블만으로 실패 지점을 국소화.
  • Hide-and-Seek실패 궤적의 일부 타임스텝을 마스킹하고, 마스킹된 타임스텝의 특징을 복원하도록 학습 — 실패 신호가 집중된 구간을 찾아냄.
  • 추론학습된 특징을 기반으로 conformal prediction 적용, 사용자 지정 허용 오차 내에서 실패 탐지.

한계·조건

  • 연산 비용궤적 내 대비 학습이 추가 연산을 요구해 실시간성에 제약이 있을 수 있음.
  • 데이터평가에 사용된 데이터셋 규모가 제한적 — 더 다양한 환경에서의 검증 필요.
  • 코드현재 코드 공개 여부 미확인.

편집자 한 줄

단계별 주석 없이도 실패 지점을 찾아내는 접근은 실제 배포에서 유용할 만합니다. 다만 연산 오버헤드가 어느 정도인지 후속 연구에서 확인해볼 필요가 있겠네요.

  • #vla
  • #failure-detection
  • #robotics
  • #contrastive-learning
  • #uw-madison
University of Wisconsin-Madison
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —