Papers·3개월 전

Meta-CoT: 이미지 편집을 위한 이중 분해 CoT — 21개 태스크 평균 15.8% 향상

Tsinghua 팀이 단일 이미지 편집 명령을 (task, target, required understanding ability) 삼중항으로 분해하고, 편집 태스크를 5가지 메타-태스크로 다시 나누는 Meta-CoT 패러다임을 제안했습니다. CoT 추론과 편집 행동 간의 일관성을 보상하는 CoT-Editing Consistency Reward를 도입해, 21개 편집 태스크에서 평균 15.8% 개선을 달성했습니다. 흥미로운 점은 소수의 메타-태스크만으로 학습해도 보지 못한 편집 태스크로 일반화가 가능하다는 것. 단, 실험 환경과 데이터셋 규모에 대한 상세는 논문을 확인해야 합니다.

#image-editing
#chain-of-thought
#multi-modal
#tsinghua
#meta-learning

Tsinghua University

원문 보기 →

Meta-CoT: 이미지 편집을 위한 이중 분해 CoT — 21개 태스크 평균 15.8% 향상

Comments