← Back to feed
Papers·1개월 전

LLaDA2.0-Uni: Unified discrete diffusion LLM matches VLM in understanding, excels in generation

LLaDA2.0-Uni: Unified discrete diffusion LLM matches VLM in understanding, excels in generation

inclusionAI의 LLaDA2.0-Uni는 이산 확산(diffusion) 기반 통합 멀티모달 LLM으로, 시각 이해와 생성 모두에서 전문 모델에 준하는 성능을 보인다. SigLIP-VQ로 시각 입력을 이산화하고 MoE 백본에서 텍스트와 함께 블록 단위 마스크 확산을 수행하며, 디코더는 고충실도 이미지를 재구성한다. 추론 효율은 prefix-aware 최적화와 소수 스텝 증류로 개선되었으며, 코드와 모델이 공개되었다.

  • #diffusion
  • #multimodal
  • #llm
  • #inclusionai
inclusionAI
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —