Ships·4시간 전
Hugging Face, 인도어 ASR 벤치마크 Vividh-ASR 공개 — Whisper 미세조정 레시피로 WER 개선

Adalat AI가 인도 언어용 ASR 벤치마크 Vividh-ASR과 Whisper 미세조정 레시피를 공개했습니다. 기존 모델이 스튜디오 녹음에 편향된 문제를 해결하기 위해 4단계 음향 복잡도로 평가를 계층화했고, 높은 학습률(2e-4)로 미세조정한 244M 파라미터 Whisper 모델이 6배 큰 공개 모델보다 전반적 WER에서 우수한 성능을 보였습니다. 커리큘럼 학습은 효과가 없었고, 오히려 어려운 조건을 먼저 학습하는 방식이 말라얄람어에서 추가 개선을 가져왔습니다. 다만 이 레시피는 법률 도메인 특화 데이터 없이 일반 음성에 국한된 점, 그리고 실제 법정 환경에서의 운영적 과제(동시 사용자 처리)는 별도 시스템 문제로 남겨둔 점을 고려해야 합니다.
- #hugging-face
- #vividh-asr
- #whisper
- #indic-languages
- #benchmark
Hugging Face