Papers·1개월 전

EviMem — 다회차 대화 기억 검색에서 증거 갭을 진단해 temporal 81.6%, multi-hop 85.2% 달성

장기 대화 기억을 검색할 때 단일 패스로는 시간적·다중 추론 질문을 놓치는데, EviMem은 IRIS라는 폐루프 프레임워크로 수집된 증거의 부족분(evidence gap)을 진단해 질의를 재정비합니다. LaceMem이라는 계층형 메모리 구조로 세밀한 갭 진단을 지원하며, LoCoMo 벤치마크에서 MIRIX 대비 temporal 73.3%→81.6%, multi-hop 65.9%→85.2%로 정확도를 높이면서 latency는 4.5배 낮췄습니다. 코드는 공개되었지만, 평가가 단일 벤치마크에 국한되어 범용성은 추가 검증이 필요합니다.

#long-context
#retrieval
#conversational-ai
#memory
#evimem

Yuyang Li

원문 보기 →

EviMem — 다회차 대화 기억 검색에서 증거 갭을 진단해 temporal 81.6%, multi-hop 85.2% 달성

Comments