Papers·어제
DeepMind, LLM 컨텍스트 최적화에 검색 도구 결합 — 저자원 번역·헬스·추론 벤치마크에서 일관된 성능 향상
DeepMind 팀이 LLM의 컨텍스트를 최적화할 때 Wikipedia 검색과 브라우저 도구를 활용하는 방법을 제안했습니다. 단순히 도구를 추가하면 오히려 성능이 떨어지지만, 여러 후보 컨텍스트를 유지·가지치기하는 검색 기반 훈련 절차를 함께 사용하면 Flores+ 저자원 번역, HealthBench, LiveCodeBench 등 다양한 태스크에서 일관된 개선을 보입니다. 데이터 효율성과 하이퍼파라미터 강건성도 확인되었으며, 생성된 텍스트 컨텍스트가 다른 모델로도 잘 전이됩니다.
- #llm
- #context-optimization
- #information-seeking
- #deepmind
- #tool-use
Deepmind