← Back to feed
Papers·3일 전

ReflectDrive-2: 이산 궤적 토큰과 마스크드 디퓨전으로 자율주행 계획 수립 — NAVSIM PDMS 91.0

ReflectDrive-2: 이산 궤적 토큰과 마스크드 디퓨전으로 자율주행 계획 수립 — NAVSIM PDMS 91.0

Huimin Wang 팀이 자율주행 계획을 이산 궤적 토큰으로 표현하고 마스크드 디퓨전으로 생성하는 ReflectDrive-2를 공개했습니다. 핵심은 AutoEdit이라는 토큰 수준의 궤적 수정 메커니즘으로, 별도의 리파인먼트 네트워크 없이 동일 모델이 선택적 토큰을 재작성합니다. 학습은 구조적 교란을 복원하는 지도학습과 전체 rollout에 RL을 적용하는 2단계로 이루어지며, RL이 편집 성능 향상에 결정적입니다(PDMS 개선폭 0.3→1.9). NAVSIM에서 카메라 전용으로 91.0 PDMS, best-of-6 오라클 설정에서 94.8 PDMS를 기록했으며 NVIDIA Thor에서 평균 31.8ms 지연시간을 보입니다.

Huimin Wang

Comments

— 첫 댓글을 남겨보세요 —