Papers·3일 전
SCOPE: 복합 이미지 생성을 위한 명세 기반 스킬 오케스트레이션 — Gen-Arena EGIP 0.60

Tianfei Ren 팀이 복잡한 시각적 의도를 충실히 구현하기 위해 '개념적 균열(Conceptual Rift)' 문제를 정의하고, 이를 해결하는 SCOPE 프레임워크를 제안했습니다. SCOPE는 진화하는 구조화된 명세서에 의미적 약속(semantic commitments)을 유지하며, 충족되지 않은 약속에 대해 검색·추론·수리 스킬을 조건부로 호출합니다. 새로 구축한 Gen-Arena 벤치마크에서 EGIP 0.60을 기록하며 모든 기준선을 크게 상회했고, WISE-V(0.907)와 MindBench(0.61)에서도 강력한 성능을 보였습니다. 다만 평가가 주로 엔티티 및 제약 수준 명세에 초점을 맞춰, 더 복잡한 관계 추론으로의 일반화는 추가 검증이 필요해 보입니다.
- #text-to-image
- #specification-guided
- #skill-orchestration
- #gen-arena
- #conceptual-rift
Tianfei Ren