News·3시간 전
AI 음악 학습 데이터 4종 공개 — 1,200만·900만 트랙 포함

The Atlantic 기자 Alex Reisner 가 AI 모델 학습에 사용된 음악 데이터셋 4종을 공개 검색 가능하게 만들었습니다. 두 개는 각각 1,200만·900만 트랙 규모, 나머지 두 개는 10만 트랙 이상입니다. Google 과 Stability AI 가 연구 논문에서 사용을 확인했으며, Free Music Archive 등 일부는 개인 스트리밍은 무료지만 학습 용도는 저작권 문제가 남아 있습니다.
AI 음악 모델 학습에 쓰인 대규모 데이터셋 4종이 공개 검색 가능해졌습니다.
골자
- 발견자 — The Atlantic 기자 Alex Reisner 가 AI 학습용 음악 데이터셋 4종을 발굴해 공개 검색 DB로 만들었습니다.
- 규모 — 가장 큰 두 개는 1,200만 트랙과 900만 트랙, 나머지 두 개는 각각 10만 트랙 이상입니다.
- 다운로드 — 데이터셋은 수천 회 다운로드되었으며, Google 과 Stability AI 가 연구 논문에서 사용을 인정했습니다.
배경·맥락
- Free Music Archive 등 일부 데이터셋은 개인 스트리밍에 무료지만, AI 학습 용도는 저작권 허가 범위 밖일 가능성이 있습니다.
- 이번 공개는 AI 음악 생성 모델의 학습 데이터 출처 투명성을 높이려는 움직임의 일환으로 보입니다.
편집자 한 줄
저작권이 명확하지 않은 음악 데이터로 학습한 모델이 상용화될 경우 법적 분쟁이 예상되는 지점입니다.
- #ai-training-data
- #music
- #copyright
- #dataset
- #atlantic
The Verge AI