Papers·어제
SAMOSA: SAM 2 기반 VOT — 비선형 운동 예측으로 일반화 12% 향상

Tsinghua 팀이 SAM 2를 비주얼 오브젝트 트래킹(VOT)에 맞게 조정한 SAMOSA를 공개했습니다. 경량 비선형 운동 예측기로 타겟 동역학을 모델링하고, 의미·기하학적 단서를 활용해 추적 실패를 복구하는 방식입니다. 일반 벤치마크에서 SAM 2 기반 기법들을 일관되게 앞질렀고, anti-UAV 데이터셋에서는 비선형 운동 환경에서 큰 폭의 성능 향상을 보였습니다. 단, SAM 2의 대규모 사전학습에 의존하므로 추론 시 compute 요구가 크다는 점은 감안해야 합니다.
- #visual-object-tracking
- #sam2
- #motion-prediction
- #tsinghua
- #video-understanding
Tsinghua University