Papers·1개월 전

One-Forcing: GAN 보조 손실로 DMD 기반 1-step 비디오 생성 개선 — VBench 83.76

Jiaqi Feng 연구팀이 DMD 기반 1-step 비디오 생성에 GAN 보조 손실을 추가한 One-Forcing을 제안했습니다. VBench 총점 83.76으로 기존 1-step 방법 중 최고 성능을 기록했으며, 4-step 대비 지연 시간을 크게 줄였습니다. 단, 학습 비용이 chunkwise 모델의 1/3 수준으로 준다는 점은 장점이나, 1-step 생성의 안정성은 여전히 제한적입니다.

1-step autoregressive 비디오 생성에서 품질 저하 없이 지연 시간을 줄이기 위해 DMD 목적 함수에 GAN 손실을 추가한 One-Forcing이 제안되었습니다.

핵심 결론

성능 — VBench 총점 83.76으로 1-step causal 비디오 생성 방법 중 SOTA, 4-step 방법과도 경쟁력 있음.
효율 — 1-step 생성으로 추론 지연 시간을 4-step 대비 75% 감소.

방법

아이디어 — DMD 기반 Self-Forcing에 GAN 판별기를 추가하여 blurry 프레임 문제를 완화.
훈련 — 1-step framewise autoregressive 생성을 chunkwise 모델의 1/3 비용으로 안정적으로 학습 가능.

한계·조건

비교 — 기존 1-step 방법 대비 우수하지만, many-step 방법과의 격차는 여전히 존재.
안정성 — 1-step 생성의 동적 움직임이 약해지는 경향이 완전히 해결되지는 않음.
코드 — 코드 공개 여부는 논문에 명시되지 않음.

편집자 한 줄

GAN 손실 도입이 DMD 기반 1-step 생성의 품질을 확실히 끌어올린 점은 인상적이지만, many-step 대비 품질 차이가 실제 서비스에서 허용 가능한 수준인지는 추가 검증이 필요해 보입니다.

#video-generation
#gan
#distillation
#one-step

Jiaqi Feng

원문 보기 →

One-Forcing: GAN 보조 손실로 DMD 기반 1-step 비디오 생성 개선 — VBench 83.76

핵심 결론

방법

한계·조건

Comments