← Back to feed
Papers·2일 전

Moebius: 0.22B 경량 인페인팅 모델이 11.9B FLUX.1-Fill-Dev와 동등한 품질, 15배 빠른 추론

Moebius: 0.22B 경량 인페인팅 모델이 11.9B FLUX.1-Fill-Dev와 동등한 품질, 15배 빠른 추론

HUSTVL 팀이 0.22B 파라미터로 11.9B FLUX.1-Fill-Dev와 견줄 만한 인페인팅 품질을 달성한 Moebius를 공개했습니다. Local-λ Mix Interaction 블록으로 공간·전역 정보를 고정 크기 선형 행렬로 요약해 파라미터를 극도로 줄였고, 잠재 공간에서 적응형 다중 입도 증류로 표현력을 보완한 점이 핵심입니다. 단, 자연 및 초상화 벤치마크에 국한된 평가이며, 일반 도메인에서의 일반화는 추가 검증이 필요합니다.

HUSTVL이 0.22B 파라미터 경량 인페인팅 모델 Moebius를 제안, 11.9B FLUX.1-Fill-Dev 대비 15배 빠른 추론 속도로 동등한 품질을 달성했습니다.

핵심 결론

  • 태스크이미지 인페인팅 — 자연 및 초상화 벤치마크에서 평가.
  • 성능0.22B 파라미터로 11.9B FLUX.1-Fill-Dev와 유사하거나 더 나은 생성 품질.
  • 효율총 추론 시간 15배 이상 가속, 파라미터는 2% 미만.

방법

  • 핵심 블록Local-λ Mix Interaction (LλMI) 블록: Local-λ 모듈이 공간 컨텍스트를, Interactive-λ 모듈이 전역 의미를 고정 크기 선형 행렬로 요약.
  • 증류잠재 공간에서 적응형 다중 입도 증류 전략으로 파라미터 손실을 보완, 고충실도 정렬 달성.
  • 구조기존 diffusion backbone을 체계적으로 재구성, 복잡한 잠재 상호작용 유지.

한계·조건

  • 벤치마크자연 및 초상화 도메인에 한정, 일반 인페인팅 시나리오에서의 일반화는 미검증.
  • 코드프로젝트 페이지 공개, 코드 및 가중치 공개 여부는 아직 불명.
  • 비교FLUX.1-Fill-Dev 단일 모델과 비교, 다른 경량 모델과의 추가 비교 필요.

편집자 한 줄

파라미터 대비 효율이 인상적이지만, 벤치마크가 제한적이라 실제 다양한 이미지에서도 동일한 품질을 유지할지는 지켜봐야겠습니다.

  • #inpainting
  • #diffusion
  • #lightweight
  • #distillation
  • #hustvl
Kangsheng Duan
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —