← Back to feed
Papers·어제

Qwen-Image-VAE-2.0: 고압축 VAE, 전역 스킵 연결로 재구성·확산 성능 개선

Qwen-Image-VAE-2.0: 고압축 VAE, 전역 스킵 연결로 재구성·확산 성능 개선

Qwen 팀이 고압축 VAE 시리즈 Qwen-Image-VAE-2.0을 공개했습니다. 전역 스킵 연결(GSC)과 확장된 잠재 채널로 재구성 병목을 해결하고, 수십억 이미지 학습 및 합성 렌더링 엔진으로 텍스트가 많은 시나리오에서 성능을 높였습니다. 또한 비대칭·어텐션 없는 인코더-디코더로 인코딩 오버헤드를 최소화했으며, 제안한 OmniDoc-TokenBench 벤치마크에서 최고 재구성 성능을 보였습니다. 다운스트림 DiT 실험에서도 기존 고압축 기준선 대비 수렴 속도가 크게 빨라져 확산 모델과의 호환성도 우수합니다.

  • #vae
  • #image-generation
  • #qwen
  • #high-compression
  • #diffusion
Qwen

Comments

— 첫 댓글을 남겨보세요 —