← Back to feed
Papers·4일 전

UNO: 이해 중심 후훈련으로 생성 표현 강화 — 이미지 생성·편집 성능 향상

UNO: 이해 중심 후훈련으로 생성 표현 강화 — 이미지 생성·편집 성능 향상

Zeyu Liu 팀이 이해(understanding)를 생성(generation)의 감독 신호로 활용하는 경량 프레임워크 UNO를 제안했습니다. 캡셔닝과 시각 회귀를 통해 생성 표현에 의미 추상화와 구조적 세부사항을 주입, 이미지 생성 및 편집 태스크에서 성능 개선을 확인했습니다. 단, 실험은 특정 모델 아키텍처에 국한되었고, 대규모 멀티모달 벤치마크에서의 일반화는 추가 검증이 필요합니다.

Zeyu Liu

Comments

— 첫 댓글을 남겨보세요 —