Papers·6일 전
PRP 재순위화를 능동적 비교 학습으로 재정의 — NDCG@10 향상, 호출당 효율 개선

Universidad de San Andrés 연구진이 Pairwise Ranking Prompting(PRP)을 잡음이 있는 쌍별 비교로부터의 능동적 학습 문제로 재정의했습니다. 기존 정렬 기반 PRP는 호출 예산 내에서 안정적인 top-K를 보장하지 못하는 반면, 제안한 능동적 순위화기는 드롭인 대체만으로도 NDCG@10을 호출당 개선합니다. 또한 무작위 방향 오라클을 도입해 위치 편향을 제거, 양방향 호출 없이도 편향 없는 순위 집계가 가능해졌습니다.
- #pairwise-ranking
- #active-learning
- #prp
- #llm
- #noise-robust
Universidad de San Andrés