← Back to feed
Papers·4일 전

MIGA: Alibaba의 train-free 무한 프레임 장편 비디오 생성 — VBench SOTA

MIGA: Alibaba의 train-free 무한 프레임 장편 비디오 생성 — VBench SOTA

Alibaba 팀이 train 없이 기존 확산 모델로 무한 길이 비디오를 생성하는 MIGA를 제안했습니다. FIFO-diffusion 계열의 프레임 단위 자기회귀 방식을 개선해, 학습-추론 간 노이즈 스케줄 불일치를 2단계 정렬 메커니즘으로 완화하고, self-reflection과 장거리 프레임 가이드로 시간적 일관성을 높인 점이 핵심입니다. VBench와 NarrLV 벤치마크에서 SOTA를 기록했지만, 메모리 소비가 일정하다는 장점은 유지한 채로요.

  • #video-generation
  • #diffusion
  • #alibaba
  • #long-video
  • #fifo-diffusion
alibaba-inc

Comments

— 첫 댓글을 남겨보세요 —