← Back to feed
Papers·2일 전

실시간 음악 생성 확산 모델 LMDM — 블록 단위 KV 캐싱으로 추론 효율 개선

실시간 음악 생성 확산 모델 LMDM — 블록 단위 KV 캐싱으로 추론 효율 개선

Zachary Novack 팀이 실시간 인터랙티브 음악 생성을 위한 확산 모델 LMDM을 제안했습니다. 기존 AR 기반 모델의 높은 연산 비용 문제를 해결하기 위해 블록 단위 KV 캐싱을 도입해 추론 복잡도를 개선했으며, ARC-Forcing 기법으로 사후 정렬 안정성을 확보했습니다. 텍스트 조건 생성, 스케치 기반 합성, 재밍 등 다양한 창작 시나리오에서 데모를 공개했고, 컨슈머 게이밍 노트북에서 실시간 연주가 가능함을 확인했습니다.

  • #music generation
  • #diffusion
  • #real-time
  • #interactive
  • #lmdm
Zachary Novack

Comments

— 첫 댓글을 남겨보세요 —