Papers·3일 전
RaV-IDP: 재구성 검증으로 문서 추출 오류 탐지 — GPT-4.1 fallback 으로 충실도 개선

Pritesh Jha 가 제안한 RaV-IDP 는 문서에서 추출한 엔티티(표, 이미지, 텍스트)를 다시 렌더링해 원본과 비교하는 충실도 점수로 검증합니다. 점수가 임계치 미만이면 GPT-4.1 vision fallback 이 트리거되어 재추출하는 방식이라, 기존 파이프라인의 무음 오류를 줄일 수 있다는 게 핵심입니다. 코드는 공개되어 있으나, GPT-4.1 호출 비용과 threshold 설정이 실제 적용의 변수로 남습니다.
- #document-processing
- #validation
- #gpt-4.1
- #pritesh-jha
Pritesh Jha