Papers·어제
UniT: 그룹 자기회귀 트랜스포머로 통합 기하 인식 — 7개 태스크 10개 벤치마크 SOTA

Haotian Wang 팀이 온라인·오프라인·멀티모달·장기·메트릭 스케일 기하 인식을 단일 프레임워크로 통합한 UniT를 공개했습니다. 핵심은 센서 관측을 그룹 단위 자기회귀 단위로 삼아 앵커 프리·스케일 적응적으로 포인트 맵을 예측하는 Group Autoregressive Transformer입니다. 온라인 모드는 단일 프레임 그룹으로 여러 스텝, 오프라인 모드는 다중 프레임 그룹을 한 번에 처리하며, 큐 스타일 KV 캐시로 장기 메모리를 제한합니다. 스케일 적응 손실과 모달 어텐션을 더해 7개 대표 태스크 10개 벤치마크에서 SOTA를 달성했지만, 학습에 대규모 데이터와 계산이 필요하다는 한계가 있습니다.
- #geometry-perception
- #transformer
- #autoregressive
- #3d-reconstruction
- #unified-model
Haotian Wang