← Back to feed
Papers·2일 전

AAD-1: 비대칭 적대적 증류로 one-step 자회귀 영상 생성 — VBench SOTA

AAD-1: 비대칭 적대적 증류로 one-step 자회귀 영상 생성 — VBench SOTA

AAD-1은 one-step 자회귀 영상 생성에서 발생하는 모션 붕괴와 훈련 불안정을 해결한 비대칭 적대적 증류 프레임워크입니다. 생성기는 인과적 구조를 유지하는 반면, 판별기는 전체 시공간 맥락에 양방향으로 주목하여 단일 홀리스틱 점수를 출력하는 비대칭 설계가 핵심입니다. 분포 매칭을 통한 웜업 단계를 먼저 거친 후 적대적 증류를 시작하는 점도 특징입니다. VBench 벤치마크에서 one-step 자회귀 영상 생성 부문 최고 성능을 기록했습니다.

AAD-1은 one-step 자회귀 영상 생성에서 모션 붕괴와 훈련 불안정을 해결한 비대칭 적대적 증류 프레임워크입니다.

핵심 결론

  • 태스크One-step 자회귀 이미지-투-비디오 생성.
  • 벤치VBench에서 one-step 자회귀 방식 중 SOTA 달성.
  • 문제기존 적대적 증류 방식은 모션 붕괴와 훈련 불안정으로 정적 영상 생성.

방법

  • 비대칭 구조생성기는 인과적(causal) 구조 유지, 판별기는 전체 시공간에 양방향 주목 후 단일 홀리스틱 점수 출력.
  • 웜업 단계분포 매칭으로 안정적인 one-step 생성기를 먼저 학습한 후 적대적 증류 시작.
  • 효과비대칭 판별기가 장거리 드리프트와 전역적 시간적 실패를 효과적으로 탐지.

한계·조건

  • 재현성코드와 모델 가중치는 아직 공개되지 않음.
  • 범위VBench 단일 벤치마크 평가로, 다른 데이터셋에서의 일반화는 추가 검증 필요.
  • 계산량웜업 단계와 비대칭 판별기로 인해 학습 비용이 증가할 가능성.

편집자 한 줄

비대칭 판별기 설계가 직관적이면서도 효과적이네요. 웜업 단계가 없으면 얼마나 불안정한지 ablation 결과도 궁금합니다.

  • #video-generation
  • #adversarial-distillation
  • #autoregressive
  • #vbench
AutoLab
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —