← Back to feed
Papers·어제

시각 생성 모델, 외형 합성 넘어 인지적 생성으로 — 5단계 분류 체계 제안

시각 생성 모델, 외형 합성 넘어 인지적 생성으로 — 5단계 분류 체계 제안

현 시각 생성 모델은 사실성과 편집 기능에서 진전을 보였으나 공간 추론, 인과 이해, 장기 일관성에서 여전히 취약합니다. 저자들은 Atomic → Conditional → In-Context → Agentic → World-Modeling Generation 의 5단계 분류 체계를 제안하며, 구조·동역학·인과를 반영한 지능적 생성(intelligent visual generation)으로의 전환을 주장합니다. flow matching, 통합 이해-생성 모델, 보상 모델링, 합성 데이터 증류 등 주요 기술 동향을 분석하고, 기존 평가가 지각 품질에 치우쳐 구조·시간·인과적 실패를 간과한다고 지적합니다.

Keming Wu

Comments

— 첫 댓글을 남겨보세요 —