Papers·6일 전
FashionChameleon: 실시간 인터랙티브 멀티-가먼트 비디오 커스터마이제이션 — 단일 GPU 23.8 FPS

Alibaba 연구진이 단일 가먼트 비디오 데이터만으로도 멀티-가먼트 비디오 커스터마이제이션을 실시간(23.8 FPS)으로 지원하는 프레임워크 FashionChameleon을 제안했습니다. 기존 방식 대비 30~180배 빠르며, 사용자가 생성 중 옷을 인터랙티브하게 바꿀 수 있습니다. 핵심은 Teacher-Student 구조의 In-Context Learning과 Training-Free KV Cache Rescheduling으로, 추가 학습 없이도 일관된 모션을 유지하며 가먼트 전환을 가능하게 합니다. 단, 단일 GPU 기준이며, 다중 가먼트 데이터 없이 학습했다는 점이 한계입니다.
- #video-generation
- #garment-customization
- #alibaba
- #in-context-learning
- #kv-cache
alibaba-inc