Papers·3일 전
SCOPE: FPS 게임용 상호작용 월드 모델 — 액션별 공간 분리로 크로스-게임 일반화

Zizhao Tong 연구팀이 FPS 게임에서 고빈도 중첩 제어 신호를 프레임 단위로 처리하는 상호작용 월드 모델 SCOPE를 제안했습니다. 기존 방법은 전역에 액션을 주입하고 단일 게임으로 학습해 FPS 입력에 취약했는데, SCOPE는 사전학습된 비디오 확산 모델의 각 트랜스포머 블록에 조건화 모듈을 삽입해 픽셀 단위 시퀀스로 특성을 재구성, 무기 주변(scope)의 국소적 효과와 안정적 배경 생성을 분리합니다. 또한 7개 게임 69K 클립의 프레임 정렬 액션 데이터셋 CrossFPS를 공개해 제로샷 전이를 입증했습니다. 단, 10-DoF 컨트롤러 신호 기반이라 키보드-마우스 환경에서의 일반화는 추가 검증이 필요합니다.
- #world-models
- #fps
- #video-diffusion
- #cross-game
- #action-conditioning
Zizhao Tong