← Back to feed
Papers·1주 전

FFAvatar: few-shot 초상화로 2초 만에 애니메이션 가능한 3D Gaussian 헤드 아바타 재구성 — NeRSemble에서 PSNR 5.5 향상

FFAvatar: few-shot 초상화로 2초 만에 애니메이션 가능한 3D Gaussian 헤드 아바타 재구성 — NeRSemble에서 PSNR 5.5 향상

FFAvatar는 여러 장의 정면 사진만으로 고품질의 애니메이션 가능한 3D Gaussian 헤드 아바타를 2초(개인화 시 10초) 만에 재구성하는 feed-forward 프레임워크입니다. Multi-View Query-Former로 다중 뷰 정보를 통합하고, FLAME 파라미터를 엔드투엔드로 예측하여 오프라인 추출 과정을 없앴습니다. 100만 명 이상의 단안 비디오로 사전 학습한 후 360도 데이터로 미세 조정하는 3단계 학습 커리큘럼으로 일반화와 정밀도를 모두 확보했으며, NeRSemble 벤치마크에서 LAM 대비 PSNR 5.5 향상을 달성했습니다. 단, 개인화 없이도 실시간(49 FPS) 애니메이션이 가능하지만, 360도 캡처 데이터의 규모가 작아 극단적인 시점에서의 일반화는 제한적일 수 있습니다.

  • #avatar-reconstruction
  • #3d-gaussians
  • #few-shot
  • #flame
  • #nersemble
Thuan Hoang Nguyen

Comments

— 첫 댓글을 남겨보세요 —