Papers·3일 전
NTM: 4-step text-to-image diffusion을 normalizing flow로 — exact likelihood 유지하며 성능 유지

Apple 연구진이 diffusion의 reverse step을 conditional normalizing flow로 대체한 Normalizing Trajectory Models(NTM)를 제안했습니다. 각 step을 얕은 invertible block과 trajectory 전체에 걸친 깊은 병렬 예측기로 구성해 exact likelihood 학습을 가능하게 했고, 자체 증류를 통해 4 step으로 고품질 샘플을 생성합니다. text-to-image 벤치마크에서 4 step만으로 강력한 baseline과 동등하거나 더 나은 성능을 내면서도 생성 궤적에 대한 exact likelihood를 유일하게 제공합니다.
- #diffusion
- #normalizing-flow
- #text-to-image
- #apple
- #few-step
Apple