← Back to feed
Papers·6일 전

AI4Bharat, 10개 인도어 TTS 평가 프레임워크 — 120K 쌍비교로 6개 지각 차원 분석

AI4Bharat, 10개 인도어 TTS 평가 프레임워크 — 120K 쌍비교로 6개 지각 차원 분석

AI4Bharat 팀이 10개 인도어(5K+ 문장)에 대해 7개 TTS 시스템을 6개 지각 차원(명료도, 표현력, 음질, 생동감, 잡음, 환각)에서 평가한 프레임워크를 공개했습니다. 1900명 이상의 원어민 평가자가 120K+ 쌍비교를 수행했고, Bradley-Terry 모델로 순위를 산출한 뒤 SHAP 분석으로 선호도 요인을 해석했습니다. 크라우드소싱 쌍비교의 변동성을 통제한 점은 좋지만, 언어별·차원별 trade-off 분석이 아직 얕다는 한계가 있습니다.

AI4Bharat

Comments

— 첫 댓글을 남겨보세요 —