Papers·2일 전
DeepRefine: LLM 에이전트가 수집한 지식 베이스의 품질을 개선하는 추론 모델

DeepRefine은 LLM 에이전트가 구축한 지식 베이스의 불완전성, 부정확성, 중복성을 사용자 질의에 맞춰 개선하는 일반적인 추론 모델입니다. 다중 턴 상호작용을 통해 결함을 진단하고 표적 수정을 수행하며, 강화 학습 기반의 Gain-Beyond-Draft 보상으로 정답 없이도 최적화합니다. 실험 결과, 다양한 다운스트림 태스크에서 일관된 성능 향상을 보였습니다.
- #llm-agents
- #knowledge-base
- #reinforcement-learning
- #deeprefine
Haoyu Huang