hypes.news
← Back to feed
Hypes·2주 전

Noam Brown 'ARC-AGI도 x축 있는 평가 차트 씀' — AI 평가 기준 부재 비판

Noam Brown이 ARC-AGI가 x축이 있는 평가 차트를 사용한다며, 대부분의 AI 평가가 그렇지 않다는 점을 지적했다. 이는 최근 LLM 벤치마크 결과 해석의 신뢰성 논란과 연결되며, 평가 방법론의 개선 필요성을 시사한다.

Noam Brown
Noam Brown@polynoamial

Comments

— 첫 댓글을 남겨보세요 —