← Back to feed
Ships·2주 전

Hugging Face, 어린이 AI 동반자 평가용 다국어 벤치마크 공개

Hugging Face, 어린이 AI 동반자 평가용 다국어 벤치마크 공개

Hugging Face 커뮤니티가 23개 언어 2,312개 아동-AI 대화 프롬프트로 구성된 다국어 벤치마크를 공개했습니다. 4개 프로덕션 LLM을 평가하고 LLM-as-judge 파이프라인을 5명의 인간 평가자로 검증했으며, 데이터셋과 iOS 앱(TinyAya)도 오픈소스로 풀었습니다. 기존 벤치마크가 성인·영어 중심인 점을 보완한 셈인데, 실제 아동 안전 사례(전기 콘센트 지시 등)에서 착안해 구축한 점이 눈에 띕니다.

  • #hugging-face
  • #benchmark
  • #multilingual
  • #children
  • #safety
Hugging Face

Comments

— 첫 댓글을 남겨보세요 —