Papers·1개월 전

Mask R-CNN 기반 도로 균열 분할 — UWGB-StreetCrack 데이터셋에서 F1 87.04%

UWGB 팀이 차량용 스마트폰으로 수집한 도로 이미지 데이터셋(UWGB-StreetCrack)에 Mask R-CNN 인스턴스 분할을 적용해 균열 면적 비율을 2.164%로 추정, 실제 2.170%에 근접한 결과를 얻었습니다. ResNet-101 FPN 백본이 가장 좋은 성능을 보였으며, YOLO 기반 검출기 대비 정밀도와 재현율이 크게 높았습니다. 다만 주석 일관성, 클래스 불균형, 마스크 수준 벤치마크 부재 등 한계도 지적됩니다.

도로 균열 평가를 위해 Mask R-CNN 인스턴스 분할을 적용한 연구로, UWGB-StreetCrack 데이터셋에서 F1 87.04%를 달성했습니다.

핵심 결론

최고 성능 — ResNet-101 FPN 백본의 Mask R-CNN이 정밀도 84.23%, 재현율 90.04%, F1 87.04% 기록.
면적 추정 — 균열 면적 비율 예측값 2.164%로 실제 2.170%와 거의 일치.
YOLO 대비 큰 차이: CSPDarknet53 기반 YOLO는 정밀도 27.5%, 재현율 20.7%에 그침.

방법

데이터셋 — 차량용 스마트폰으로 촬영한 도로 이미지에 폴리곤 라벨링(종방향 균열, 횡방향 균열, 악어 균열, 포트홀).
모델 — Detectron2 기반 Mask R-CNN, 5가지 백본(ResNet-50/101 FPN 등)을 동일 파인튜닝 프로토콜로 비교.
매칭 프로토콜: 프로젝트 특화 바운딩 박스 매칭 방식으로 평가.

한계·조건

주석 일관성 — 수동 라벨링의 변동성으로 인해 정확한 마스크 수준 평가가 어려움.
클래스 불균형 — 일부 균열 유형(예: 악어 균열)의 샘플 수가 적어 성능 편차 존재.
벤치마크 — 마스크 수준의 표준 벤치마크가 부재하여 다른 연구와 직접 비교 어려움.

편집자 한 줄

실용적인 도로 유지보수 관점에서 인스턴스 분할이 검출 대비 유의미한 이점을 보여준 사례입니다. 다만 데이터셋 규모와 주석 비용이 실배포의 걸림돌일 수 있겠네요.

#mask-rcnn
#pavement-crack
#instance-segmentation
#uwgb-streetcrack

Logan Dewick

원문 보기 →

Mask R-CNN 기반 도로 균열 분할 — UWGB-StreetCrack 데이터셋에서 F1 87.04%

핵심 결론

방법

한계·조건

Comments