hypes.news
← Back to feed
Hypes·5일 전

Ethan Mollick "LLMs are still not consistent judges of qualitative work" — jagged frontier persists

Ethan Mollick이 LLM이 정성적 작업 평가에서 여전히 일관성이 부족하며, 제시 방식의 작은 변화가 결과에 영향을 미친다고 지적했다. 무작위 순서의 다중 평가 등 방법 개선이 도움될 수 있지만, '들쭉날쭉한 프론티어'는 여전히 현실이라고 강조한다. 이는 LLM의 신뢰성 한계를 재확인한 발언으로, AI 평가 도구 사용 시 주의가 필요함을 시사한다.

Ethan Mollick
Ethan Mollick@emollick

Comments

— 첫 댓글을 남겨보세요 —