Ships·3개월 전

Hugging Face, Nemotron OCR v2 공개 — 합성 데이터로 훈련된 다국어 OCR 모델

Hugging Face가 NVIDIA의 Nemotron OCR v2를 공개했다. 합성 데이터 생성 방식으로 수백만 장의 주석 이미지-텍스트 쌍을 확보, 기존 벤치마크 대비 규모와 라벨 정확도를 동시에 높였다. ICDAR, Total-Text 등 기존 데이터셋은 수만 장 규모에 영어·중국어 편중이었으나, Nemotron OCR v2는 다양한 언어와 레이아웃을 지원한다. 다만 합성 데이터의 현실감이 성능에 영향을 줄 수 있어 실제 문서 일반화는 추가 검증이 필요하다.

#hugging-face
#nvidia
#nemotron-ocr-v2
#ocr
#synthetic-data

Hugging Face

원문 보기 →

Hugging Face, Nemotron OCR v2 공개 — 합성 데이터로 훈련된 다국어 OCR 모델

Comments