Papers·2일 전
단일 LLM 기반 최적화 시스템, 6개 도메인에서 SOTA — ARC-AGI 89.5%, 클라우드 비용 40% 절감

Lakshya A Agrawal 팀이 텍스트 최적화를 단일 프레임워크로 통합한 'optimize_anything' 시스템을 공개했습니다. ARC-AGI에서 Gemini Flash의 정확도를 32.5%에서 89.5%로 향상시키고, 클라우드 스케줄링 비용을 40% 절감했으며, CUDA 커널 87%가 PyTorch와 동등하거나 더 나은 성능을 보였습니다. 핵심은 actionable side information이 score-only 피드백보다 빠른 수렴과 높은 최종 점수를 이끌어낸 점이며, multi-task search가 cross-task transfer를 통해 독립 최적화보다 우수함을 보였습니다. 단, 모든 태스크가 텍스트 artifact와 scoring function으로 공식화 가능해야 한다는 조건이 붙습니다.
- #llm
- #optimization
- #arc-agi
- #cuda
- #scheduling
Lakshya A Agrawal