Papers·2일 전
Moebius: 0.22B 경량 인페인팅 모델이 11.9B FLUX.1-Fill-Dev와 동등한 품질, 15배 빠른 추론

HUSTVL 팀이 0.22B 파라미터로 11.9B FLUX.1-Fill-Dev와 견줄 만한 인페인팅 품질을 달성한 Moebius를 공개했습니다. Local-λ Mix Interaction 블록으로 공간·전역 정보를 고정 크기 선형 행렬로 요약해 파라미터를 극도로 줄였고, 잠재 공간에서 적응형 다중 입도 증류로 표현력을 보완한 점이 핵심입니다. 단, 자연 및 초상화 벤치마크에 국한된 평가이며, 일반 도메인에서의 일반화는 추가 검증이 필요합니다.
HUSTVL이 0.22B 파라미터 경량 인페인팅 모델 Moebius를 제안, 11.9B FLUX.1-Fill-Dev 대비 15배 빠른 추론 속도로 동등한 품질을 달성했습니다.
핵심 결론
- 태스크 — 이미지 인페인팅 — 자연 및 초상화 벤치마크에서 평가.
- 성능 — 0.22B 파라미터로 11.9B FLUX.1-Fill-Dev와 유사하거나 더 나은 생성 품질.
- 효율 — 총 추론 시간 15배 이상 가속, 파라미터는 2% 미만.
방법
- 핵심 블록 — Local-λ Mix Interaction (LλMI) 블록: Local-λ 모듈이 공간 컨텍스트를, Interactive-λ 모듈이 전역 의미를 고정 크기 선형 행렬로 요약.
- 증류 — 잠재 공간에서 적응형 다중 입도 증류 전략으로 파라미터 손실을 보완, 고충실도 정렬 달성.
- 구조 — 기존 diffusion backbone을 체계적으로 재구성, 복잡한 잠재 상호작용 유지.
한계·조건
- 벤치마크 — 자연 및 초상화 도메인에 한정, 일반 인페인팅 시나리오에서의 일반화는 미검증.
- 코드 — 프로젝트 페이지 공개, 코드 및 가중치 공개 여부는 아직 불명.
- 비교 — FLUX.1-Fill-Dev 단일 모델과 비교, 다른 경량 모델과의 추가 비교 필요.
편집자 한 줄
파라미터 대비 효율이 인상적이지만, 벤치마크가 제한적이라 실제 다양한 이미지에서도 동일한 품질을 유지할지는 지켜봐야겠습니다.
- #inpainting
- #diffusion
- #lightweight
- #distillation
- #hustvl
Kangsheng Duan