← Back to feed
Papers·1개월 전

RPI, 논문급 과학 다이어그램 생성을 위한 DiagramBank 데이터셋 공개 — 89,422개 도식

RPI, 논문급 과학 다이어그램 생성을 위한 DiagramBank 데이터셋 공개 — 89,422개 도식

Rensselaer Polytechnic Institute 팀이 AI 과학자 시스템의 'end-to-end' 논문 생성에서 핵심 병목이었던 teaser figure 자동 생성을 위해 DiagramBank 데이터셋을 공개했습니다. 기존 AI 과학자 시스템은 데이터 플롯과 다른 개념적 합성이 필요한 도식(diagram) 생성을 생략하거나 열등한 대안에 의존했는데, DiagramBank는 89,422개의 도식을 CLIP 기반 필터로 선별하고 캡션·초록 등 풍부한 컨텍스트를 제공합니다. retrieval-augmented generation 코드베이스도 함께 공개되어, 유사한 도식을 검색해 조건부 합성하는 파이프라인을 바로 실험해볼 수 있습니다.

Rensselaer Polytechnic Institute

Comments

— 첫 댓글을 남겨보세요 —