Papers·어제
AsymFlow: 저차원 잡음 예측으로 고차원 플로우 생성 효율화 — ImageNet 256×256 FID 1.57
Stanford 팀이 Asymmetric Flow Modeling(AsymFlow)을 제안했습니다. 속도 예측 시 잡음 성분을 저차원 부분공간으로 제한하고 데이터 성분은 전차원을 유지하는 비대칭 파라미터화로, 네트워크 구조 변경 없이 전차원 속도를 해석적으로 복원합니다. ImageNet 256×256에서 FID 1.57로 DiT/JiT 계열 픽셀 확산 모델을 큰 폭으로 앞질렀습니다. 또한 FLUX.2 klein 9B를 픽셀 공간으로 파인튜닝하는 첫 경로를 제시, HPSv3·DPG-Bench·GenEval에서 잠재 기반을 능가하고 시각적 사실성도 개선했습니다.
- #flow-matching
- #image-generation
- #stanford
- #pixel-space
- #asymflow
Stanford University