← Back to feed
Papers·3주 전

UniCharacter: 10장 이미지로 캐릭터 페르소나·스타일·시각 정체성 통합 학습

UniCharacter: 10장 이미지로 캐릭터 페르소나·스타일·시각 정체성 통합 학습

UniCharacter는 캐릭터의 페르소나, 대화 스타일, 시각적 정체성을 텍스트와 이미지 모두에서 일관되게 유지하는 다중모달 역할극(CMRP) 과제를 제안하고, 20개 캐릭터로 구성된 RoleScape-20 데이터셋을 구축했습니다. Unified-SFT와 Character-GRPO라는 2단계 학습 프레임워크로, 10장의 이미지와 상호작용 예시만으로 약 100 GPU 시간에 캐릭터를 학습합니다. 실험에서 기존 방법을 크게 능가했지만, 20개 캐릭터로 제한된 데이터셋과 100 GPU 시간의 계산 비용이 한계입니다.

  • #multimodal
  • #role-play
  • #character-customization
  • #unified-model
  • #grpo
Chao Tang

Comments

— 첫 댓글을 남겨보세요 —