← Back to feed
Papers·2일 전

Ego-Exo4D 동작 숙련도 추정 — SkillFormer·PATS·ProfVLM, 최대 20배 적은 파라미터로 SOTA

Ego-Exo4D 동작 숙련도 추정 — SkillFormer·PATS·ProfVLM, 최대 20배 적은 파라미터로 SOTA

Ego-Exo4D 데이터셋에서 사람의 동작 숙련도를 추정하는 세 가지 방법이 제안됐습니다. SkillFormer는 선택적 다중 뷰 융합을 위한 파라미터 효율적 아키텍처, PATS는 기본 동작의 국소 밀집 구간을 보존해 시간 샘플링을 개선, ProfVLM은 조건부 언어 생성으로 숙련도 레이블과 전문가 피드백을 함께 출력합니다. 이들은 비디오 트랜스포머 대비 최대 20배 적은 학습 파라미터, 최대 3배 적은 에폭으로 SOTA 정확도를 달성했으며, 해석 가능한 피드백 생성으로 방향을 전환했다는 점이 특징입니다.

Edoardo Bianchi

Comments

— 첫 댓글을 남겨보세요 —