Papers·1개월 전

SemEval-2026 Task 8 우승 — 7개 LLM 이종 앙상블로 conditioned harmonic mean 0.7827 달성

Novosibirsk State University 팀이 SemEval-2026 Task 8 (참조 문서 기반 생성)에서 7개 LLM의 이종 앙상블로 1위를 차지했습니다. GPT-4o-mini가 각 인스턴스에 가장 적합한 후보를 선택하는 방식으로, conditioned harmonic mean 0.7827을 기록해 강력한 단일 모델(gpt-oss-120b, 0.6390)을 크게 앞질렀습니다. 모델 패밀리·스케일·프롬프트 전략의 다양성이 핵심이며, 7B 도메인 적응 모델 Meno-Lite-0.1도 함께 공개했습니다. 코드는 공개되어 있으나, 태스크 특화 벤치마크 결과라는 점과 주석 한계가 분석에서 지적되었습니다.

#ensemble
#semeval
#llm
#generation
#novosibirsk

Novosibirsk State University

원문 보기 →

SemEval-2026 Task 8 우승 — 7개 LLM 이종 앙상블로 conditioned harmonic mean 0.7827 달성

Comments