Papers·3일 전
AutoTTS: 환경 기반 자동 TTS 전략 탐색 — 수학 추론에서 accuracy-cost tradeoff 개선

Google 연구진이 LLM의 test-time scaling(TTS) 전략을 수동 설계 대신 환경 기반 자동 탐색하는 AutoTTS 프레임워크를 제안했습니다. width-depth TTS를 controller synthesis 문제로 정식화하고, 사전 수집된 추론 궤적과 probe 신호를 활용해 분기·계속·탐색·가지치기·중단을 결정하는 컨트롤러를 학습합니다. 수학 추론 벤치마크에서 수동 설계된 강력한 기준선 대비 accuracy-cost tradeoff를 개선했으며, 발견된 전략은 미관측 벤치마크와 모델 규모에 일반화됩니다. 전체 탐색 비용은 39.9달러, 160분에 불과하며 코드와 데이터는 공개 예정입니다.
- #test-time-scaling
- #llm
- #mathematical-reasoning
Google