← Back to feed
Papers·어제

Theta One AI, 코드 스위칭 ASR의 언어 쌍 일반화 가능성 탐구 — 병합 모델이 보지 못한 언어 쌍에도 전이

Theta One AI, 코드 스위칭 ASR의 언어 쌍 일반화 가능성 탐구 — 병합 모델이 보지 못한 언어 쌍에도 전이

Theta One AI 연구진이 코드 스위칭 ASR에서 제한된 언어 쌍으로 학습한 능력이 보지 못한 언어 쌍으로 일반화되는지 조사했습니다. 병합된 이중 언어 CS-ASR 모델이 보지 못한 언어 쌍에 대해 약간의 일반화를 보였으나, 전이 정도는 제한적이었습니다. 이는 CS 지원을 모든 언어 쌍에 확장하는 데 근본적인 어려움이 있음을 시사합니다.

Theta One AI가 코드 스위칭 ASR에서 언어 쌍 일반화 가능성을 실험했습니다.

핵심 결론

  • 태스크코드 스위칭 ASR에서 보지 못한 언어 쌍에 대한 일반화 성능 측정.
  • 결과병합된 이중 언어 CS-ASR 모델이 보지 못한 언어 쌍에 대해 약간의 일반화를 보였으나, 전이 정도는 제한적.

방법

  • 접근제한된 언어 쌍으로 학습한 CS-ASR 모델을 병합(모델 병합)하고, 도메인 일반화 기법을 적용하여 보지 못한 언어 쌍에서 테스트.
  • 데이터합성 CS 음성 및 제한된 이중 언어 데이터셋 사용.

한계·조건

  • 일반화전이 능력이 제한적이어서, 모든 언어 쌍에 대해 개별 학습이 필요할 가능성이 큼.
  • 확장성언어 쌍 수가 조합적으로 증가하는 문제를 해결하지 못함.

편집자 한 줄

코드 스위칭 ASR의 확장성 문제를 명확히 지적한 실험으로, 향후 연구 방향 설정에 도움이 될 만합니다.

  • #asr
  • #code-switching
  • #model-merging
  • #domain-generalization
  • #theta-one-ai
Theta One AI
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —