Papers·4일 전
MIGA: Alibaba의 train-free 무한 프레임 장편 비디오 생성 — VBench SOTA

Alibaba 팀이 train 없이 기존 확산 모델로 무한 길이 비디오를 생성하는 MIGA를 제안했습니다. FIFO-diffusion 계열의 프레임 단위 자기회귀 방식을 개선해, 학습-추론 간 노이즈 스케줄 불일치를 2단계 정렬 메커니즘으로 완화하고, self-reflection과 장거리 프레임 가이드로 시간적 일관성을 높인 점이 핵심입니다. VBench와 NarrLV 벤치마크에서 SOTA를 기록했지만, 메모리 소비가 일정하다는 장점은 유지한 채로요.
- #video-generation
- #diffusion
- #alibaba
- #long-video
- #fifo-diffusion
alibaba-inc