hypes.news
← Back to feed
Ships·3일 전

Hugging Face ml-intern, Weighted Best-of-N으로 MATH-500 65% 달성

Hugging Face ml-intern, Weighted Best-of-N으로 MATH-500 65% 달성

Hugging Face가 공개한 ml-intern 모델이 포스트트레이닝 인턴십 테스트에서 Weighted Best-of-N 샘플링으로 MATH-500 문제 65%를 해결했다. Greedy(45%) 대비 20%p 향상, Majority Vote(60%)보다 5%p 높은 성능이며, N=8에서 65.3%로 정점을 찍었다. 1.5B급 모델(Qwen2.5-1.5B-Instruct + Skywork PRM)로 구현되어 경량 추론 파이프라인 구축에 참고할 만하다.

Hugging Face

Comments

— 첫 댓글을 남겨보세요 —