Papers·5일 전
TexOCR: PDF에서 컴파일 가능한 LaTeX로 재구성 — 2B 모델, SFT+RL로 구조 충실도 개선

Chengye Wang 팀이 과학 PDF를 컴파일 가능한 LaTeX로 재구성하는 태스크를 위한 벤치마크(TexOCR-Bench)와 학습 데이터(TexOCR-Train)를 공개하고, 2B 파라미터 모델 TexOCR을 SFT와 RL로 학습했습니다. LaTeX 단위 테스트에서 컴파일 가능성과 참조 무결성을 보상으로 하는 RL이 SFT 대비 구조 및 컴파일 메트릭에서 일관된 개선을 보였습니다. 다만 2B 모델 기준이며, 21개 최신 모델 평가에서 기존 시스템이 문서 구조 불변성을 자주 위반한다는 분석도 포함됩니다.
- #latex
- #ocr
- #document-reconstruction
- #rl
Chengye Wang