Papers·3개월 전

Diffusion 모델의 다중 객체 생성 실패 원인 — 데이터 관점에서 분석한 scene complexity와 counting의 한계

텍스트-이미지 diffusion 모델이 다중 객체 생성에서 불안정한 원인을 데이터 관점에서 분석한 연구가 공개되었습니다. 연구진은 개념 일반화와 조합 일반화 두 가지 설정에서 데이터셋 크기와 scene complexity가 지배적 역할을 하며, 특히 counting은 저데이터 환경에서 학습이 어렵다는 점을 밝혔습니다. 조합 일반화는 학습 중 생략된 개념 조합이 많아질수록 급격히 붕괴하는데, 이는 diffusion 모델의 근본적 한계를 보여주며 강력한 귀납적 편향과 데이터 설계의 필요성을 시사합니다.

#text-to-image
#diffusion
#multi-object
#compositional-generation
#data-analysis

Yujin Jeong

원문 보기 →

Diffusion 모델의 다중 객체 생성 실패 원인 — 데이터 관점에서 분석한 scene complexity와 counting의 한계

Comments