← Back to feed
Papers·3일 전

UniSHARP: 단일 이미지로 다양한 카메라 시스템에서 포토리얼리스틱 뷰 합성

UniSHARP: 단일 이미지로 다양한 카메라 시스템에서 포토리얼리스틱 뷰 합성

Insta360 연구팀이 SHARP를 확장한 UniSHARP를 제안, 단일 이미지로부터 일반 카메라, 광각, 어안, 파노라마까지 다양한 시야각에서 포토리얼리스틱 뷰를 합성합니다. 핵심은 이미지를 통합된 전방위 잠재 공간에 정렬하고, Gaussian 프리미티브를 광선 기반 표현으로 배치하는 방식입니다. 자체 구축한 다양한 FoV 벤치마크에서 기존 방법 대비 큰 폭으로 성능이 개선되었습니다.

Insta360 연구팀이 단일 이미지로 다양한 카메라 시스템(일반, 광각, 어안, 파노라마)에서 포토리얼리스틱 뷰를 합성하는 UniSHARP를 공개했습니다.

핵심 결론

  • 태스크단일 이미지 기반 universal monocular rendering — 다양한 시야각(FoV)의 카메라 시스템에서 새로운 시점의 포토리얼리스틱 이미지를 생성.
  • 성능자체 구축한 다양한 FoV 벤치마크에서 기존 방법(예: SHARP, PixelSplat) 대비 PSNR, SSIM, LPIPS 모두 큰 폭으로 개선.

방법

  • 핵심 아이디어SHARP의 pinhole 가정을 극복하기 위해, 다양한 이미지를 통합된 전방위(omnidirectional) 잠재 공간에서 정렬.
  • Gaussian 표현Gaussian 프리미티브를 광선(ray)과 방사 거리(radial distance) 기반의 광선 기반 표현으로 배치.
  • 인코더UniK3D에서 영감을 받은 인코더로 2D 의미 및 3D 공간 특징을 추출, 이를 공동 디코딩하여 전체 Gaussian 클라우드를 생성.

한계·조건

  • 벤치마크FoV별로 세분화된 자체 벤치마크에서 평가했으나, 실제 다양한 환경에서의 일반화 검증은 추가 필요.
  • 코드프로젝트 페이지(https://insta360-research-team.github.io/Unisharp-website/)에서 데모와 추가 정보 제공, 코드 공개 여부는 미정.

편집자 한 줄

단일 이미지로 다양한 카메라 시스템을 커버한다는 점이 실용적이네요. 다만 벤치마크가 자체 구축된 점은 감안할 필요가 있습니다.

  • #view-synthesis
  • #gaussian-splatting
  • #omnidirectional
  • #insta360
Meixi Song
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —