Papers·4일 전
VGenST-Bench — 생성 모델로 합성한 시공간 추론 벤치마크, MLLM 평가 패러다임 전환

VGenST-Bench는 생성 모델을 활용해 능동적으로 합성한 비디오로 MLLM의 시공간 추론을 평가하는 벤치마크입니다. 기존 정적 이미지나 수동 수집 비디오의 한계를 넘어, 3x2x2 비디오 분류 체계(공간 규모, 시점, 장면 동역학)와 계층적 태스크로 세밀한 진단이 가능합니다. 다중 에이전트 파이프라인과 인간 QC를 거쳐 QA 쌍의 품질을 보장했으며, 수동 큐레이션에서 능동 합성으로 패러다임을 전환했다는 점이 핵심입니다.
- #multimodal
- #benchmark
- #spatio-temporal-reasoning
- #generative-model
- #mllm
Jinho Park