Ships·3개월 전
Mistral, LLM-as-Judge 평가 프레임워크 공개 — RAG 시스템 자동 평가 지원

Mistral AI 가 자사 모델을 활용한 'LLM-as-Judge' 평가 솔루션을 발표했다. 이 프레임워크는 RAG 시스템의 출력 정확성과 검색 문서의 관련성을 구조화된 출력으로 평가하며, 기존 정량적 지표가 부족한 도메인에서도 확장 가능한 자동 평가를 제공한다. Mistral 모델 기반으로 수치·이진·정성적 척도를 지원하며, 현재 API로 이용 가능하다.
- #mistral
- #rag
- #llm-as-judge
- #evaluation
Mistral