Papers·2일 전
Mask R-CNN 기반 도로 균열 분할 — UWGB-StreetCrack 데이터셋에서 F1 87.04%

UWGB 팀이 차량용 스마트폰으로 수집한 도로 이미지 데이터셋(UWGB-StreetCrack)에 Mask R-CNN 인스턴스 분할을 적용해 균열 면적 비율을 2.164%로 추정, 실제 2.170%에 근접한 결과를 얻었습니다. ResNet-101 FPN 백본이 가장 좋은 성능을 보였으며, YOLO 기반 검출기 대비 정밀도와 재현율이 크게 높았습니다. 다만 주석 일관성, 클래스 불균형, 마스크 수준 벤치마크 부재 등 한계도 지적됩니다.
도로 균열 평가를 위해 Mask R-CNN 인스턴스 분할을 적용한 연구로, UWGB-StreetCrack 데이터셋에서 F1 87.04%를 달성했습니다.
핵심 결론
- 최고 성능 — ResNet-101 FPN 백본의 Mask R-CNN이 정밀도 84.23%, 재현율 90.04%, F1 87.04% 기록.
- 면적 추정 — 균열 면적 비율 예측값 2.164%로 실제 2.170%와 거의 일치.
- YOLO 대비 큰 차이: CSPDarknet53 기반 YOLO는 정밀도 27.5%, 재현율 20.7%에 그침.
방법
- 데이터셋 — 차량용 스마트폰으로 촬영한 도로 이미지에 폴리곤 라벨링(종방향 균열, 횡방향 균열, 악어 균열, 포트홀).
- 모델 — Detectron2 기반 Mask R-CNN, 5가지 백본(ResNet-50/101 FPN 등)을 동일 파인튜닝 프로토콜로 비교.
- 매칭 프로토콜: 프로젝트 특화 바운딩 박스 매칭 방식으로 평가.
한계·조건
- 주석 일관성 — 수동 라벨링의 변동성으로 인해 정확한 마스크 수준 평가가 어려움.
- 클래스 불균형 — 일부 균열 유형(예: 악어 균열)의 샘플 수가 적어 성능 편차 존재.
- 벤치마크 — 마스크 수준의 표준 벤치마크가 부재하여 다른 연구와 직접 비교 어려움.
편집자 한 줄
실용적인 도로 유지보수 관점에서 인스턴스 분할이 검출 대비 유의미한 이점을 보여준 사례입니다. 다만 데이터셋 규모와 주석 비용이 실배포의 걸림돌일 수 있겠네요.
- #mask-rcnn
- #pavement-crack
- #instance-segmentation
- #uwgb-streetcrack
Logan Dewick