Papers·1개월 전

BM25 + GPT-5.5 로 BrowseComp-Plus 83.1% 정확도 — Pi-Serini 검색 에이전트

Pi-Serini 는 BM25 어휘 검색기와 최신 LLM(gpt-5.5) 을 결합한 검색 에이전트로, BrowseComp-Plus 벤치마크에서 83.1% 정답 정확도와 94.7% 증거 재현율을 기록하며 dense retriever 기반 에이전트를 능가했습니다. 핵심은 BM25 의 retrieval depth 와 파라미터 튜닝으로, 기본 설정 대비 정확도 18.0% 향상, 깊은 검색 시 재현율 25.3% 추가 개선을 확인했습니다. 단, 이 성능은 충분한 검색 깊이와 강력한 LLM 추론 능력에 의존하므로 경량 환경에서는 재현이 어려울 수 있습니다.

#bm25
#retrieval
#llm-agent
#browsecomp
#deep-research

Tz-Huan Hsu

원문 보기 →

BM25 + GPT-5.5 로 BrowseComp-Plus 83.1% 정확도 — Pi-Serini 검색 에이전트

Comments