← Back to feed
Papers·4일 전

Harmony: 코드 진행 시퀀스로 11개 장르 적응 — LoRA·IA3·BitFit·Prefix Tuning 비교

Harmony: 코드 진행 시퀀스로 11개 장르 적응 — LoRA·IA3·BitFit·Prefix Tuning 비교

Harmony는 팝-재즈 Music Transformer를 11개 장르(블루스, 보사노바, 바흐 코랄, 컨트리, 일렉트로닉, 포크, 펑크, 가스펠, 힙합, R&B/소울, 록)에 적응시킨 연구입니다. LoRA, IA3, BitFit, prefix tuning, full fine-tuning을 165개 셀 그리드로 비교한 결과, 모든 방법이 frozen base 대비 코드 예측 정확도를 2.89~3.61포인트 개선했으나 통계적으로 우월한 방법은 없었습니다. 데이터 크기를 통제하자 IA3가 가장 안정적이었고, 잘못된 장르 어댑터도 base를 능가하는 등 경량 조건화의 효과가 컸습니다. 코드 시퀀스만으로 장르 정체성을 완전히 포착할 수 없다는 한계도 명시했습니다.

코드 진행 시퀀스만으로 11개 장르의 화성 패턴을 학습할 수 있을까? 5가지 적응 방법을 165개 그리드로 비교한 실험입니다.

핵심 결론

  • 태스크팝-재즈 Music Transformer를 11개 장르에 적응, held-out 코드 예측 정확도 평가.
  • 개선폭모든 방법이 frozen base 대비 +2.89~+3.61 포인트 향상.
  • 우열LoRA와 IA3가 가장 높은 점수를 기록했으나 통계적 우위는 없음.

방법

  • 적응 방법LoRA, IA3, BitFit, prefix tuning, full fine-tuning을 11개 장르×3 seed로 비교.
  • 데이터 통제장르별 말뭉치 크기를 동일하게 맞추자 IA3가 최고, LoRA는 최하위로 떨어짐.
  • 조건화 효과잘못된 장르 어댑터도 frozen base를 능가, 경량 조건화가 주된 효과임을 시사.

한계·조건

  • 표현력코드 시퀀스만으로 장르 정체성을 완전히 포착할 수 없음.
  • 평가 범위지각된 장르 진정성이나 전체 음악 품질은 청취자 평가가 필요.
  • 재현성코드 공개 여부는 명시되지 않았으나, Hugging Face Papers에 등록.

편집자 한 줄

경량 적응 방법 간 차이가 미미하다는 점은 실용적인 선택에 도움이 될 만합니다. 다만 코드 시퀀스만으로 장르를 완전히 모델링하기 어렵다는 결론은 당연하면서도 명시적으로 검증한 점이 의미 있네요.

  • #music-transformer
  • #chord-symbol
  • #genre-adaptation
  • #lora
  • #ia3
Jinju Lee
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —