Papers·2일 전
PRISM: 단일 스텝 확산 기반 텍스트 이미지 초해상도 — Flow Matching과 구조적 잔차 인코더로 1ms 추론

DeepSeek 연구진이 텍스트 이미지 초해상도(Text-SR)에서 stroke 위상 오류를 해결하는 단일 스텝 확산 프레임워크 PRISM을 공개했습니다. Flow-Matching Prior Rectification(FMPR)으로 저화질 입력에서 추출한 텍스트 조건을 정제하고, Structure-guided Uncertainty-aware Residual Encoder(SURE)로 불확실한 stroke 경계를 선택적으로 보강합니다. 합성 및 실제 벤치마크에서 SOTA를 달성했으며, 추론 시간은 밀리초 수준입니다. 단, 8x A100 환경 기준으로 학습되었으며 단일 GPU에서의 성능은 추가 검증이 필요합니다.
- #text-sr
- #super-resolution
- #diffusion
- #flow-matching
- #deepseek
DeepSeek