← Back to feed
Papers·어제

Holo-World: 단일 이미지로 카메라·객체·날씨를 동시 제어하는 비디오 월드 모델

Holo-World: 단일 이미지로 카메라·객체·날씨를 동시 제어하는 비디오 월드 모델

Holo-World는 단일 이미지에서 카메라·객체 움직임과 날씨 전환을 동시에 제어하는 통합 비디오 월드 모델입니다. Unified Scene Adapter가 세계 보존과 날씨 전이를 별도 파라미터 공간으로 분리하고, Scene-Weather Decomposed CFG로 날씨 효과를 강화합니다. 기존 비디오-투-비디오 날씨 편집 기준선보다 우수한 성능을 보였으나, 데이터셋 규모와 제어 정밀도에 한계가 있습니다.

Holo-World는 단일 이미지를 기반으로 카메라·객체·날씨를 통합 제어하는 비디오 월드 모델로, 세계 보존과 날씨 전이를 분리해 처리합니다.

핵심 결론

  • 태스크단일 이미지에서 카메라·객체 제어와 날씨 전환(예: 맑음→눈)을 동시에 수행하는 비디오 생성.
  • 성능날씨 상태 생성에서 비디오-투-비디오 편집 기준선보다 정량·정성적으로 우수.
  • 데이터HoloStateData: 기존 비디오를 제어 샘플로 변환한 통합 데이터셋 구축.

방법

  • Unified Scene Adapter세계 보존과 날씨 전이를 별도 파라미터 서브스페이스로 분해, 렌더링된 배경·지오메트리 버퍼·객체 제어로 구조 유지.
  • Scene-Weather Decomposed CFG장면과 날씨 잔차를 별도로 안내하여 조건 과증폭 없이 날씨 효과 강화.
  • 제어카메라·객체 움직임을 명시적으로 제어하면서 날씨 지시(예: "rainy")를 따름.

한계·조건

  • 데이터HoloStateData의 규모와 다양성이 제한적일 가능성.
  • 제어 정밀도복잡한 객체 움직임이나 극단적 날씨 전환에서 정밀도 저하 가능.
  • 공개코드와 데이터셋은 아직 공개되지 않음 (프로젝트 페이지에서 추후 업데이트 예정).

편집자 한 줄

단일 이미지에서 여러 제어를 통합한 점은 실용적이나, 실제 배포를 위해서는 더 큰 데이터셋과 제어 정밀도 개선이 필요해 보입니다.

  • #video-generation
  • #world-model
  • #weather-transfer
  • #control
  • #holo-world
Xiangchen Yin
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —