Papers·2일 전
SwiftI2V: 조건부 세그먼트 생성으로 2K I2V GPU 시간 202배 단축

SwiftI2V는 2K 해상도 이미지-투-비디오(I2V) 생성을 위한 효율적인 프레임워크로, VBench-I2V에서 종단간 모델과 유사한 성능을 내면서 GPU 시간을 202배 줄였습니다. 저해상도 모션 참조를 생성한 후 강력한 이미지 조건부 2K 합성을 수행하는 2단계 설계를 따르며, Conditional Segment-wise Generation(CSG)으로 세그먼트별 토큰 예산을 제한해 확장성을 높였습니다. 단일 H800 또는 RTX 4090에서도 2K I2V 생성이 가능하지만, 세그먼트 간 일관성은 양방향 컨텍스트 상호작용으로 보완해야 합니다.
- #image-to-video
- #high-resolution
- #efficient-generation
- #swifti2v
YaoYang Liu