Papers·어제
Theta One AI, 코드 스위칭 ASR의 언어 쌍 일반화 가능성 탐구 — 병합 모델이 보지 못한 언어 쌍에도 전이

Theta One AI 연구진이 코드 스위칭 ASR에서 제한된 언어 쌍으로 학습한 능력이 보지 못한 언어 쌍으로 일반화되는지 조사했습니다. 병합된 이중 언어 CS-ASR 모델이 보지 못한 언어 쌍에 대해 약간의 일반화를 보였으나, 전이 정도는 제한적이었습니다. 이는 CS 지원을 모든 언어 쌍에 확장하는 데 근본적인 어려움이 있음을 시사합니다.
Theta One AI가 코드 스위칭 ASR에서 언어 쌍 일반화 가능성을 실험했습니다.
핵심 결론
- 태스크 — 코드 스위칭 ASR에서 보지 못한 언어 쌍에 대한 일반화 성능 측정.
- 결과 — 병합된 이중 언어 CS-ASR 모델이 보지 못한 언어 쌍에 대해 약간의 일반화를 보였으나, 전이 정도는 제한적.
방법
- 접근 — 제한된 언어 쌍으로 학습한 CS-ASR 모델을 병합(모델 병합)하고, 도메인 일반화 기법을 적용하여 보지 못한 언어 쌍에서 테스트.
- 데이터 — 합성 CS 음성 및 제한된 이중 언어 데이터셋 사용.
한계·조건
- 일반화 — 전이 능력이 제한적이어서, 모든 언어 쌍에 대해 개별 학습이 필요할 가능성이 큼.
- 확장성 — 언어 쌍 수가 조합적으로 증가하는 문제를 해결하지 못함.
편집자 한 줄
코드 스위칭 ASR의 확장성 문제를 명확히 지적한 실험으로, 향후 연구 방향 설정에 도움이 될 만합니다.
- #asr
- #code-switching
- #model-merging
- #domain-generalization
- #theta-one-ai
Theta One AI