Hypes·5시간 전
Ethan Mollick "Erdos 문제만으론 부족 — AI 평가용 난제 저장소 필요"

Ethan Mollick 이 Erdos 문제 같은 난제 저장소가 수학 외 공학·경제·생물학 등 다양한 분야에도 필요하다고 주장했네요. 수학은 검증이 쉬워 AI 평가에 유리하지만, 일상 생활과의 연결이 약한 반면, 다른 분야의 복잡한 문제는 AI 능력의 실질적 영향을 측정하기 좋다는 게 요지. AI 벤치마크 다양화 논의에 한 조각 더하는 셈입니다.
- #ai-benchmarks
- #erdos-problems
- #ethan-mollick
- #evaluation
Ethan Mollick@emollick