Papers·2일 전
ABot-Earth 0.5: 위성 이미지로 10분/km² 대규모 3D 환경 생성

Alibaba AMAP CV Lab이 위성 이미지만으로 1km²당 10분 미만의 속도로 사실적인 3D 도시 환경을 생성하는 생성형 프레임워크 ABot-Earth 0.5를 공개했습니다. 3D Gaussian Splatting을 직접 생성 모델에 통합해 기존 도시 재구성 데이터로 학습하며, 계층적 LOD 구조로 웹 기반 지도 엔진에서 실시간 인터랙티브 시각화를 지원합니다. 단, 학습 데이터셋 규모와 다양성에 대한 구체적인 정보는 공개되지 않았습니다.
Alibaba AMAP CV Lab이 위성 이미지만으로 1km²당 10분 미만의 속도로 사실적인 3D 도시 환경을 생성하는 생성형 프레임워크를 공개했습니다.
핵심 결론
- 생성 속도 — 위성 이미지 조건부로 1km²당 10분 미만으로 3D 장면 합성.
- 표현 방식 — 3D Gaussian Splatting (3DGS)을 직접 생성 모델의 표현으로 사용.
- 시각화 — 계층적 LOD 구조로 웹 기반 지도 엔진에서 실시간 인터랙티브 렌더링 가능.
방법
- 생성 모델 — 기존 실제 도시 재구성 데이터로 학습한 생성형 3DGS 모델.
- 조건부 생성 — 추론 시 위성 이미지만 입력으로 받아 새로운 3D 장면을 합성.
- LOD 구조 — 통합된 계층적 LOD로 웹 기반 시각화에 최적화.
한계·조건
- 데이터 — 학습 데이터셋의 규모와 다양성, 도시 유형별 성능 차이에 대한 정보는 아직 공개되지 않았습니다.
- 평가 — 정량적 평가 지표(예: FID, PSNR)가 논문에 포함되었는지 확인 필요.
- 코드 — 현재 Hugging Face 논문 페이지에서 abstract만 공개, 코드 및 모델 가중치 공개 여부 미정.
편집자 한 줄
생성 속도와 웹 기반 시각화는 실용적이지만, 생성 품질의 일반화와 sim-to-real 격차 해소 효과는 추가 검증이 필요해 보입니다.
- #3d-generation
- #gaussian-splatting
- #satellite-imagery
- #alibaba
- #urban-reconstruction
Alibaba AMAP CV Lab