Hypes·5일 전
Ethan Mollick "오픈 웨이트 모델, 벤치마크에 비해 실제 성능 낮아" — Kimi 지적
Ethan Mollick 이 "오픈 웨이트 모델이 벤치마크 대비 실제 사용에서 과대평가되는 경향" 이라며 Kimi 를 예시로 들었다. "실제로 써보면 Kimi 가 벤치마크에서 이긴 Claude Opus 4.6 만 못하다" 고 지적. 벤치마크 신뢰성 논란에 무게를 싣는 발언으로, 오픈 모델의 실용성 평가 기준을 다시 생각하게 한다.
- #ethan-mollick
- #open-weights
- #kimi
- #benchmarks
- #claude
Ethan Mollick@emollick