Hypes·어제
OpenAI 'evals' 팀장 Tejal Patwardhan, 벤치마크 포화·게이밍 문제 진단

OpenAI 가 공식 계정으로 evals(평가)의 중요성을 재차 강조했습니다. 프론티어 evals 팀장 Tejal Patwardhan이 Andrew Mayne과의 인터뷰에서 "벤치마크가 포화되거나 게이밍되는 상황"을 지적하며, 모델이 다음으로 평가받아야 할 기준을 논의했다고 밝혔네요. 평가 방법론 자체가 경쟁력이 되는 분위기입니다.
- #openai
- #evals
- #benchmarks
- #tejal-patwardhan
OpenAI@OpenAI