← Back to feed
Papers·4일 전

Delta-Adapter: 단일 쌍 지도로 이미지 편집 변환 학습 — Perceiver 기반 semantic delta 주입

Delta-Adapter: 단일 쌍 지도로 이미지 편집 변환 학습 — Perceiver 기반 semantic delta 주입

Delta-Adapter는 기존 exemplar 기반 이미지 편집에서 요구되던 두 쌍의 학습 데이터를 단일 쌍으로 줄인 방법입니다. 사전 학습된 vision encoder로 source-target 간 semantic delta(시각 변환)를 추출하고, Perceiver 기반 어댑터를 통해 편집 모델에 주입합니다. target 이미지를 모델에 직접 노출하지 않아 단일 쌍 지도 학습이 가능하며, semantic delta consistency loss로 변환 충실도를 높였습니다. 네 가지 강력한 baseline 대비 편집 정확도와 내용 일관성을 개선했고, 보지 못한 편집 태스크로의 일반화도 더 좋습니다. 단, 코드는 공개 예정이며 학습 데이터 규모나 추론 비용에 대한 구체적 분석은 논문에 포함되지 않았습니다.

Jiacheng Chen

Comments

— 첫 댓글을 남겨보세요 —