← Back to feed
Papers·4일 전

RISE: 검색 에이전트를 위한 상호작용 공간 구축 — BM25로 경계 설정, BrowseComp-Plus 78% 정확도

RISE: 검색 에이전트를 위한 상호작용 공간 구축 — BM25로 경계 설정, BrowseComp-Plus 78% 정확도

Shengyao Zhuang 팀이 에이전트 검색에서 기존의 순위-읽기 방식을 대체할 RISE(Retrieving Interaction SpacE)를 제안했습니다. 핵심은 검색이 단순히 문서를 선택하는 것이 아니라, 에이전트가 탐색할 수 있는 경계 있는 상호작용 공간을 구성하는 것. BM25로 공간을 구축하고 문서를 셸 도구에 맞게 전처리해, BrowseComp-Plus에서 pure-shell DCI와 동등한 78% 정확도를 쿼리당 비용 1/4로 달성했습니다. 100만 문서 규모에서는 DCI가 60%로 떨어지는 반면 RISE는 81%를 유지했으나, BM25 의존성과 대규모 인덱싱 오버헤드가 한계입니다.

에이전트 검색에서 순위-읽기 패러다임을 넘어, 검색이 상호작용 공간을 구성해야 한다는 접근법 RISE가 제안되었습니다.

핵심 결론

  • 태스크BrowseComp-Plus 벤치마크에서 gpt-5.4-mini 기준 78% 정확도, pure-shell DCI와 동등.
  • 비용쿼리당 비용은 DCI 대비 약 1/4 수준으로 줄었습니다.
  • 확장성100만 문서에서 RISE-BM25는 81%를 기록, DCI(gpt-5.4-nano)는 60%로 하락하며 33%의 타임아웃 발생.

방법

  • 상호작용 공간검색을 단순 문서 선택이 아닌, 에이전트가 셸 도구(grep 등)로 탐색할 수 있는 경계 있는 부분집합으로 정의.
  • 구성BM25로 초기 문서 집합을 선택하고, 인덱싱 단계에서 문서를 줄 단위로 분할해 셸 네비게이션에 최적화.
  • 도구에이전트는 이 공간 내에서 grep, head, tail 등으로 직접 상호작용하며 답변을 구성.

한계·조건

  • 검색기 의존BM25 외의 검색기(신경 검색 등)와의 조합은 실험되지 않아 일반화에 한계.
  • 인덱싱 비용문서 전처리에 추가 인덱싱 오버헤드가 발생하지만, 쿼리당 비용 절감으로 상쇄 가능.
  • 코드현재 코드 공개 여부는 명시되지 않았습니다.

편집자 한 줄

검색 에이전트의 설계 공간을 넓히는 흥미로운 프레임워크입니다. BM25 외 검색기와의 호환성, 대규모 동적 코퍼스에서의 갱신 비용이 실용화 관건이 될 듯합니다.

  • #retrieval
  • #agentic-search
  • #rise
  • #bm25
  • #browsecomp
Shengyao Zhuang
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —