← Back to feed
Hypes·15시간 전

Noam Brown 'GPT-5.5 모든 벤치마크 50% 이상…GQPA는 이제 은퇴'

Noam Brown 'GPT-5.5 모든 벤치마크 50% 이상…GQPA는 이제 은퇴'

Noam Brown 이 새 eval 의 낮은 점수를 보고 반색하며, GPT-5.5 발표 당시 거의 모든 벤치마크가 50%를 넘었다고 회고했네요. 이제 GQPA 같은 eval 은 은퇴시키고 새로운 세트를 도입할 때라고 강조합니다. 최근 모델 성능이 워낙 올라가면서 기존 벤치마크의 변별력이 떨어진 걸 정면으로 짚은 셈입니다.

  • #noam-brown
  • #gpt-5.5
  • #eval
  • #gqpa
Noam Brown
Noam Brown@polynoamial

Comments

— 첫 댓글을 남겨보세요 —