Papers·2일 전
IBM SPIN: DAG 기반 계획 검증으로 LLM 에이전트 워크플로우 오류 41% 감소

IBM 연구진이 제안한 SPIN은 LLM 에이전트의 계획 수립 단계에서 DAG(방향성 비순환 그래프) 구조를 강제하고, 프리픽스 기반 실행 제어로 불필요한 작업을 조기 중단하는 래퍼(wrapper)입니다. AssetOpsBench(261개 시나리오)에서 실행된 작업(task) 수를 1061→623으로 줄이고, Accomplished 점수는 0.638→0.706으로 개선했으며, 호출당 툴 사용 횟수는 11.81→6.82로 감소했습니다. MCP Bench에서도 GPT-OSS1과 Llama 4 Maverick 모두 계획·근거·의존성 점수가 향상되었습니다. 단, SPIN은 계획 검증과 수정에 추가 LLM 호출이 필요해 지연 시간이 소폭 증가할 수 있습니다.
- #llm-agent
- #planning
- #dag
- #ibm
- #workflow-optimization
IBM