Papers·2일 전
FrontierSmith: 폐쇄형 코딩 문제를 개방형으로 진화시켜 LLM 코딩 능력 향상 — Qwen3.5-27B, ALE-bench +309 Elo

FrontierSmith는 기존의 폐쇄형 코딩 문제(예: 경쟁 프로그래밍)를 자동으로 개방형 문제로 변환하는 시스템입니다. 문제의 목표 변경, 출력 제한, 입력 일반화를 통해 다양한 해결책을 유도하는 문제를 생성하고, 정량적 발산 지표로 선별한 후 테스트 케이스와 검증기를 붙입니다. Qwen3.5-9B와 27B 모델에 적용한 결과, FrontierCS와 ALE-bench에서 각각 +8.82/+12.12 점, +306.36/+309.12 Elo 향상을 보였습니다. 단, 생성된 문제의 난이도와 다양성은 시드 문제의 품질에 의존적이며, 완전히 새로운 도메인으로의 일반화는 검증되지 않았습니다.
- #llm
- #code-generation
- #open-ended
- #qwen
- #frontiersmith
Runyuan He