Papers·6일 전
PianoCoRe — 250,046개 연주 포함한 대규모 피아노 MIDI 데이터셋, 노트 정렬 및 품질 분류기 제공

PianoCoRe는 기존 오픈소스 피아노 코퍼스를 통합·정제한 대규모 MIDI 데이터셋으로, 483명 작곡가의 5,625곡에 대한 250,046개 연주(총 21,763시간)를 포함합니다. 계층적 서브셋(PianoCoRe-C/B/A/A*)을 제공하며, 특히 노트 정렬 서브셋 PianoCoRe-A는 1,591개 악보에 정렬된 157,207개 연주로 현재까지 가장 큰 오픈소스 컬렉션입니다. 함께 공개된 MIDI 품질 분류기와 정렬 정제 파이프라인(RAScoP)을 통해 temporal noise와 템포 이상치를 줄였고, 이 데이터로 학습한 표현적 연주 모델이 미지의 곡에 대해 더 강건함을 보였습니다. 단, 데이터셋은 MIDI 형식에 국한되며 실제 오디오는 포함하지 않습니다.
- #midi
- #dataset
- #piano
- #mir
- #expressive-performance
SyMuPe