Hypes·2일 전
Ethan Mollick "10개 중 7개 풀었는데 '기대 이하'라니" — LLM 수학 능력 평가 논란

Ethan Mollick 이 'AI 가 기대에 못 미쳤다'는 헤드라인에 이의를 제기했네요. 15개월 전엔 LLM 이 수학을 아예 못 했는데, 지금은 10개의 새로운 고난도 문제 중 7개를 풀었다는 점을 지적하며, 실제 연구는 AI 의 수학적 강점과 한계를 잘 드러낸다고 평가. LLM 의 수학 능력 향상 속도와 여전히 남은 취약점을 동시에 보여주는 사례.
- #llm
- #math
- #benchmark
- #ethan-mollick
Ethan Mollick@emollick