Papers·어제
Qwen-Image-VAE-2.0: 고압축 VAE, 전역 스킵 연결로 재구성·확산 성능 개선
Qwen 팀이 고압축 VAE 시리즈 Qwen-Image-VAE-2.0을 공개했습니다. 전역 스킵 연결(GSC)과 확장된 잠재 채널로 재구성 병목을 해결하고, 수십억 이미지 학습 및 합성 렌더링 엔진으로 텍스트가 많은 시나리오에서 성능을 높였습니다. 또한 비대칭·어텐션 없는 인코더-디코더로 인코딩 오버헤드를 최소화했으며, 제안한 OmniDoc-TokenBench 벤치마크에서 최고 재구성 성능을 보였습니다. 다운스트림 DiT 실험에서도 기존 고압축 기준선 대비 수렴 속도가 크게 빨라져 확산 모델과의 호환성도 우수합니다.
- #vae
- #image-generation
- #qwen
- #high-compression
- #diffusion
Qwen