Hypes·1개월 전

Ethan Mollick "MAI-Thinking-1 점수만 보면 판단 어려워" — MS 모델 체험 난항 지적

Ethan Mollick이 Microsoft의 새 추론 모델 MAI-Thinking-1에 대해 "점수만으로는 성능을 알기 어렵다"고 평했네요. 특히 GPQA와 Terminal Bench 2.0 점수가 이상하게 낮고, 출시 직후 모델을 직접 써보기 어렵다는 점을 꼬집었습니다. "메타의 Spark 아래 수준"이라는 평가도 덧붙였는데, MS AI 제품 특유의 접근성 문제가 또 도마 위에 오른 셈입니다.

#microsoft
#maithinking1
#ethan-mollick
#ai-evaluation

Ethan Mollick@emollick

원문 보기 →

Ethan Mollick "MAI-Thinking-1 점수만 보면 판단 어려워" — MS 모델 체험 난항 지적

Comments