Papers·2일 전
Stream-R1: 보상 기반 가중치 재조정으로 비디오 생성 증류 품질 향상

FrameX-AI 팀이 자동회귀 스트리밍 비디오 생성 모델의 증류 과정에서 신뢰도와 복잡도를 고려한 Stream-R1 프레임워크를 제안했습니다. 기존 DMD 방식은 모든 rollout과 프레임을 동일하게 취급했지만, Stream-R1은 비디오 보상 모델을 활용해 rollout 수준의 신뢰도와 공간-시간 요소의 복잡도를 적응적으로 가중치 부여합니다. 표준 벤치마크에서 시각적 품질, 모션 품질, 텍스트 정렬 세 가지 측면 모두에서 일관된 개선을 보였으며, 아키텍처 변경이나 추가 추론 비용 없이 달성했습니다. 다만 보상 모델 자체의 품질에 의존적이라는 한계가 있습니다.
- #video-generation
- #distillation
- #reward-model
- #streaming
- #frameX-ai
FrameX-AI