Papers·1개월 전

OSU NLP, 오픈소스 딥 리서치 에이전트 QUEST 공개 — 8개 벤치마크에서 최고 성능

OSU NLP 팀이 2B~35B 규모의 오픈소스 딥 리서치 에이전트 QUEST를 공개했습니다. QUEST는 사실 탐색, 인용 근거, 보고서 합성 등 다양한 장기 검색 태스크에서 frontier 폐쇄형 에이전트에 근접하거나 능가하는 성능을 보이며, 8개 벤치마크에서 오픈소스 중 최고 성능을 기록했습니다. 핵심은 중간 학습, 지도 미세 조정, 강화 학습을 결합한 훈련 레시피와 통합 루브릭 트리 기반 데이터 합성 파이프라인으로, 사람 주석 없이 검증 가능한 보상을 제공합니다. 단 8K 합성 태스크만으로 훈련했으며, 모델·데이터·훈련 스크립트를 모두 공개했습니다.

#deep-research
#open-source
#quest
#osu-nlp
#reinforcement-learning

OSU NLP Group

원문 보기 →

OSU NLP, 오픈소스 딥 리서치 에이전트 QUEST 공개 — 8개 벤치마크에서 최고 성능

Comments