Papers·어제
단순 SFT만으로 최첨단 검색 에이전트 — OpenSeeker-v2, 30B 규모에서 BrowseComp 46.0% 달성

순수 학술팀이 SFT만으로 산업계의 CPT+SFT+RL 파이프라인을 능가하는 검색 에이전트를 개발했습니다. 10.6k 데이터로 학습된 OpenSeeker-v2는 BrowseComp 46.0%, BrowseComp-ZH 58.1%, HLE 34.6%, xbench 78.0%를 기록하며, Tongyi DeepResearch를 모든 벤치마크에서 앞질렀습니다. 핵심은 지식 그래프 확장, 도구 세트 확대, 엄격한 저단계 필터링이라는 세 가지 데이터 합성 기법입니다. 단, 30B 규모 ReAct 에이전트에 국한된 결과이며, 더 큰 모델이나 다른 패러다임으로의 일반화는 추가 검증이 필요합니다.
- #search-agent
- #sft
- #open-source
- #30b
- #react
Yuwen Du