Papers·1주 전
MLLM 필기 인식, 고위험 교육에 쓸 수준 아니다 — EDU-CIRCUIT-HW 벤치마크

대학 STEM 과정의 실제 학생 손글씨 1,300+ 건을 수록한 EDU-CIRCUIT-HW 데이터셋으로 MLLM의 인식 충실도와 자동 채점 성능을 평가한 결과, 인식 오류가 자동 채점을 비롯한 이해 중심 응용에 치명적일 정도로 광범위하게 존재함을 발견했습니다. 연구팀은 오류 패턴을 사전 탐지해 수동 개입(3.3%만 인간 채점)으로 보완하는 방안을 제시했지만, 근본적으로 현재 MLLM의 신뢰성은 고위험 교육 환경에 부적합하다는 점을 강조합니다.
- #multimodal
- #education
- #benchmark
- #handwriting-recognition
- #mllm
Weiyu Sun