Papers·2일 전
Co-Director: 계층적 멀티 에이전트로 비디오 스토리텔링의 의미 일관성 확보 — GenAD-Bench 400 시나리오에서 SOTA 대비 우위

Google 연구진이 확산 모델 기반 비디오 생성에서 의미적 일관성을 유지하며 스토리텔링을 최적화하는 계층적 멀티 에이전트 프레임워크 Co-Director를 제안했습니다. 전역적으로는 multi-armed bandit이 창의적 방향을 탐색하고, 지역적으로는 multimodal self-refinement loop가 캐릭터·객체의 identity drift를 막아 시퀀스 수준의 일관성을 보장합니다. 가상 제품 개인화 광고용 400개 시나리오 데이터셋 GenAD-Bench에서 SOTA 대비 유의미한 성능 향상을 보였으며, 코드는 공개되지 않았습니다.
- #diffusion-models
- #video-generation
- #storytelling
- #multi-agent
Google