← Back to feed
Papers·2일 전

자연 이미지의 기하학적 구조 활용 — Spherical Flow Matching 이 Euclidean 대비 우수

자연 이미지의 기하학적 구조 활용 — Spherical Flow Matching 이 Euclidean 대비 우수

자연 이미지의 semantic 정보는 방향 성분에 집중되어 있고 norm 성분은 전역 평균으로 근사 가능하다는 관찰을 바탕으로, hypersphere 상에서의 flow matching 방법인 SOT-CFM 과 SFM 을 제안했습니다. 구면 거리를 활용한 optimal transport 와 manifold 직접 제약이 Euclidean baseline 대비 이미지 생성 성능을 개선했네요. 흥미로운 점은 RGB 와 latent space 모두에서 동일한 기하학적 특성이 관찰되었다는 것. Riemannian manifold 기반 생성 모델과 자연 이미지 사이의 간극을 좁힌 연구입니다.

  • #flow-matching
  • #image-generation
  • #geometry
  • #optimal-transport
  • #manifold
Junho Lee

Comments

— 첫 댓글을 남겨보세요 —