Papers·어제
KAIST WorldKV — 학습 없는 KV 캐시 압축·검색으로 비디오 월드 일관성 유지

KAIST 팀이 자동회귀 비디오 확산 모델에서 긴 롤아웃 시 메모리 부담 없이 시점 일관성을 유지하는 WorldKV를 제안했습니다. World Retrieval은 evict된 KV 청크를 GPU/CPU 메모리에 저장했다가 카메라·액션 대응으로 관련 청크를 검색해 attention window에 삽입하고, World Compression은 앵커 프레임 대비 key-key 유사도로 중복 토큰을 절반으로 줄입니다. Matrix-Game-2.0과 LingBot-World-Fast에서 full-KV 메모리 충실도를 따라잡으면서 처리량은 2배 가까이 높고, 미세조정 없이도 memory-trained baseline과 경쟁합니다.
- #video-diffusion
- #kv-cache
- #world-model
- #kaist
KAIST AI