Papers·2일 전
ThinC: 코드 자체를 추론자로 활용한 수학 문제 해결 — 4B 모델로 235B MoE 추월

Korea University 연구진이 제안한 ThinC는 기존 tool-integrated reasoning(TIR)의 한계(코드가 사후 검증자 역할, NL 중간 계산 오류, NL과 코드 역할 중복)를 극복하기 위해 코드 자체를 추론자로 사용합니다. ThinC-4B는 다섯 개의 경쟁 수학 벤치마크에서 모든 TIR baseline을 능가하고, Qwen3-235B-A22B-Thinking보다도 높은 성능을 보였습니다. 99.2%의 최종 답변이 인터프리터 출력에 근거하며, 코드 실행 실패 시 NL 중간 추론 없이도 복구가 가능합니다. 단, 12.2k 개의 코드 중심 trajectory를 teacher 모델로부터 증류하여 학습했으며, 코드와 모델은 곧 공개 예정입니다.
- #code-reasoning
- #mathematical-reasoning
- #korea-university
- #thinC
- #TIR
Korea University