Papers·1개월 전

Spreadsheet-RL: 강화학습으로 엑셀 에이전트 성능 2배 향상 — Qwen3-4B, SpreadsheetBench Pass@1 12.0%→23.4%

UIUC 연구진이 강화학습(RL) 미세조정을 통해 엑셀 에이전트의 복잡한 다단계 워크플로우 처리 능력을 크게 개선한 Spreadsheet-RL 프레임워크를 공개했습니다. 기존 일반 LLM 기반 접근 대비 RL 전용 환경(Spreadsheet Gym)과 자동화된 데이터 수집 파이프라인을 도입해, Qwen3-4B-Think 모델의 SpreadsheetBench Pass@1을 12.0%에서 23.4%로, 금융·공급망 등 도메인 데이터셋에서는 8.4%에서 17.2%로 끌어올렸습니다. 다만 실험 환경이 Python sandbox 기반의 가상 엑셀 환경에 국한되어 실제 GUI 엑셀과의 괴리가 있을 수 있다는 점은 염두에 둘 필요가 있습니다.

#reinforcement-learning
#spreadsheet
#llm-agent
#uiuc
#excel

University of Illinois at Urbana-Champaign

원문 보기 →

Spreadsheet-RL: 강화학습으로 엑셀 에이전트 성능 2배 향상 — Qwen3-4B, SpreadsheetBench Pass@1 12.0%→23.4%

Comments