← Back to feed
Papers·어제

iWorld-Bench: 세계 모델의 물리적 상호작용 능력 평가 벤치마크 — 330K 비디오 클립, 14개 모델 평가

iWorld-Bench: 세계 모델의 물리적 상호작용 능력 평가 벤치마크 — 330K 비디오 클립, 14개 모델 평가

iWorld-Bench는 세계 모델의 물리적 상호작용 능력을 평가하기 위한 대규모 벤치마크로, 330K 비디오 클립과 2.1K 고품질 샘플로 구성됩니다. Action Generation Framework를 도입해 6가지 태스크 유형(시각 생성, 궤적 추종, 메모리 등)으로 4.9K 테스트 샘플을 생성했으며, 14개 대표 세계 모델을 평가해 주요 한계를 식별했습니다. 데이터셋과 리더보드는 공개되어 있습니다.

Jianjie Fang

Comments

— 첫 댓글을 남겨보세요 —