← Back to feed
Hypes·7시간 전

Ethan Mollick "MAI-Thinking-1 점수만 보면 판단 어려워" — MS 모델 체험 난항 지적

Ethan Mollick이 Microsoft의 새 추론 모델 MAI-Thinking-1에 대해 "점수만으로는 성능을 알기 어렵다"고 평했네요. 특히 GPQA와 Terminal Bench 2.0 점수가 이상하게 낮고, 출시 직후 모델을 직접 써보기 어렵다는 점을 꼬집었습니다. "메타의 Spark 아래 수준"이라는 평가도 덧붙였는데, MS AI 제품 특유의 접근성 문제가 또 도마 위에 오른 셈입니다.

  • #microsoft
  • #maithinking1
  • #ethan-mollick
  • #ai-evaluation
Ethan Mollick
Ethan Mollick@emollick
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —