Papers·1주 전
TT4D: 140시간 탁구 단식·복식 3D 재구성 데이터셋 — lift-first 파이프라인으로 occlusion 극복

Chair for Machine Learning & Computer Vision 팀이 단안 브로드캐스트 영상에서 140시간 분량의 탁구 경기를 3D로 재구성한 대규모 데이터셋 TT4D를 공개했습니다. 기존 2D 기반 샷 분할 방식이 occlusion과 다양한 카메라 시점에서 실패하는 문제를 뒤집어, 먼저 학습 기반 네트워크로 전체 2D 볼 궤적을 3D로 리프팅한 후 시간 분할을 수행하는 lift-first 설계가 핵심입니다. 이 파이프라인은 볼 스핀까지 추정하며, 일반 시점 방송 영상에서 유일하게 동작합니다. 라켓 자세 및 충돌 속도 추정과 경기 생성 모델 학습이라는 두 가지 다운스트림 태스크로 데이터셋의 충실도를 검증했습니다.
- #table-tennis
- #3d-reconstruction
- #dataset
- #sports-analytics
Chair for Machine Learning & Computer Vision