← Back to feed
Papers·3일 전

SLIDERS — SQL 기반 구조적 추론으로 장문 문서 QA, GPT-4.1 대비 평균 6.6점 향상

SLIDERS — SQL 기반 구조적 추론으로 장문 문서 QA, GPT-4.1 대비 평균 6.6점 향상

Stanford NLP 팀이 장문 문서 QA를 위해 SLIDERS 프레임워크를 제안했습니다. 문서를 청크로 분해하는 대신, 핵심 정보를 관계형 데이터베이스로 추출하고 SQL을 통해 추론함으로써 확장성 문제를 해결합니다. 데이터 정합성을 위해 출처와 추론 근거를 활용한 중복·불일치 수정 단계를 도입한 점이 특징입니다. 기존 3개 벤치마크에서 GPT-4.1 대비 평균 6.6점 높은 성능을 보였으며, 3.9M·36M 토큰 규모의 새 벤치마크에서는 다음 베이스라인 대비 각각 약 19점·32점 향상되었습니다.

Stanford NLP

Comments

— 첫 댓글을 남겨보세요 —