Hypes·2주 전
Noam Brown 'ARC-AGI도 x축 있는 평가 차트 씀' — AI 평가 기준 부재 비판
Noam Brown이 ARC-AGI가 x축이 있는 평가 차트를 사용한다며, 대부분의 AI 평가가 그렇지 않다는 점을 지적했다. 이는 최근 LLM 벤치마크 결과 해석의 신뢰성 논란과 연결되며, 평가 방법론의 개선 필요성을 시사한다.
- #noam-brown
- #arc-agi
- #ai-evaluation
- #benchmarks
Noam Brown@polynoamial