Papers·어제
World Action Models: VLA와 월드 모델 통합의 체계적 분류 — Cascaded/Joint WAMs, 데이터 생태계, 평가 프로토콜

OpenMOSS 팀이 VLA 모델에 물리 세계의 상태 전이를 명시적으로 모델링하는 World Action Models (WAMs) 패러다임을 체계적으로 정리한 서베이를 발표했습니다. 기존 VLA가 reactive mapping에 그친 반면, WAMs는 미래 상태와 행동의 결합 분포를 학습하며, Cascaded(분리 생성)와 Joint(통합 생성)로 분류됩니다. 데이터는 로봇 원격조작, 인간 시연, 시뮬레이션, 인터넷 규모 에고센트릭 비디오를 포괄하며, 평가는 시각적 충실도, 물리적 상식, 행동 타당성으로 구성됩니다. 아직 표준화된 벤치마크가 부족하다는 한계가 있습니다.
- #world-models
- #vla
- #embodied-ai
- #survey
- #openmoss
OpenMOSS