Papers·2일 전
FlowCompile: LLM 워크플로우를 컴파일 관점에서 최적화 — 최대 6.4x 속도 향상

UMass Amherst 연구팀이 구조화된 LLM 워크플로우를 배포 전 컴파일 시점에 전역 탐색하여 최적화하는 FlowCompile을 제안했습니다. 기존의 라우팅 기반 방법과 달리, 서브 에이전트별 프로파일링을 통해 워크플로우 수준의 정확도-지연 시간 트레이드오프를 사전에 구성해 재사용 가능한 설정 세트를 만듭니다. 다양한 워크플로우와 벤치마크에서 휴리스틱 최적화 대비 최대 6.4배 속도 향상을 보였으며, 재학습 없이 단일 컴파일 패스로 동작합니다. 다만 실험 환경에 대한 구체적인 GPU 사양 등은 공개되지 않았습니다.
- #llm-workflow
- #optimization
- #compilation
- #umass
University of Massachusetts Amherst