Papers·1개월 전

WorldReasonBench: 비디오 생성 모델의 세계 추론 능력을 평가하는 새로운 벤치마크

UniX Lab이 비디오 생성 모델이 단순한 시각적 그럴듯함을 넘어 물리·사회·논리·정보적 일관성을 갖춘 세계 상태 예측을 수행하는지 평가하는 WorldReasonBench를 공개했습니다. 436개의 테스트 케이스와 4가지 추론 차원, 22개 하위 범주로 구성되며, 생성된 비디오는 과정 인식 검증과 다차원 품질 평가로 분석됩니다. 현대 비디오 생성기들은 시각적 그럴듯함과 세계 추론 사이에 지속적인 격차를 보였으며, 코드와 데이터셋은 GitHub에 공개될 예정입니다.

#video-generation
#benchmark
#world-reasoning
#unix-lab

UniX Lab

원문 보기 →

WorldReasonBench: 비디오 생성 모델의 세계 추론 능력을 평가하는 새로운 벤치마크

Comments