Papers·3일 전
Code-as-Room: MLLM 에이전트가 Blender 코드로 3D 실내 공간 생성 — top-down 이미지에서 공간 관계 추출

Shanghai AI Lab 팀이 MLLM 기반 에이전트 프레임워크 Code-as-Room을 공개했습니다. top-down 실내 이미지를 입력받아 Blender 실행 코드로 3D 방을 합성하며, 기존 텍스트 기반 방식이 공간 정보를 잡지 못하는 문제와 이미지 기반 에이전트의 무한 루프·불안정성을 해결합니다. 핵심은 다단계 파이프라인으로 geometry, material, lighting을 분리 생성하고 cross-stage memory로 맥락 유실을 막는 설계. 단, 전용 벤치마크에서 기존 에이전트 대비 우수함을 보였지만 Blender 코드 생성에 특화되어 있어 다른 3D 포맷으로의 일반화는 추가 검증이 필요합니다.
- #3d-room-synthesis
- #mllm
- #blender
- #shanghai-ailab
shanghai ailab