Papers·2주 전

NUS, LLM 에이전트 장기 기억 추론 개선 — MRAgent, LoCoMo 벤치마크 최대 23% 향상

싱가포르국립대(NUS) 팀이 LLM 에이전트의 장기 대화 이력 추론 문제를 해결하는 MRAgent 프레임워크를 제안했습니다. 기존 정적 retrieve-then-reason 방식을 탈피해, Cue-Tag-Content 그래프 기반 연상 기억 구조와 LLM 추론을 직접 메모리 접근에 통합하는 능동 재구성 메커니즘을 도입했습니다. LoCoMo 및 LongMemEval 벤치마크에서 최대 23% 성능 향상을 보였고, 토큰 및 런타임 비용도 크게 줄였습니다.

NUS 팀이 LLM 에이전트의 장기 기억 추론을 개선하는 MRAgent 프레임워크를 공개했습니다.

핵심 결론

성능 — LoCoMo 및 LongMemEval 벤치마크에서 기존 강력한 기준선 대비 최대 23% 향상.
효율 — 토큰 및 런타임 비용을 크게 줄이면서도 추론 정확도를 높였습니다.

방법

기억 구조 — Cue-Tag-Content 그래프를 사용해 미세한 단서(cue)와 기억 내용(content)을 연상 태그(tag)로 연결합니다.
능동 재구성 — LLM 추론을 메모리 접근에 통합, 누적 증거에 따라 검색 경로를 반복적으로 탐색하고 가지치기합니다.
정적 retrieve-then-reason 파이프라인 대신 추론 맥락에 따라 동적으로 메모리 접근을 조정하는 점이 핵심입니다.

한계·조건

벤치마크 — LoCoMo와 LongMemEval 두 벤치마크에서 평가되었으며, 더 다양한 도메인에서의 검증이 필요합니다.
코드 — 현재 코드 공개 여부는 명시되지 않았습니다.

편집자 한 줄

기억 구조에 그래프를 도입하고 LLM 추론을 검색 과정에 녹인 설계가 깔끔합니다. 다만 실제 배포 시 그래프 규모가 커질 경우 오버헤드가 어떻게 될지는 지켜봐야겠네요.

#llm-agents
#memory
#reasoning
#nus

National University of Singapore

원문 보기 →

NUS, LLM 에이전트 장기 기억 추론 개선 — MRAgent, LoCoMo 벤치마크 최대 23% 향상

핵심 결론

방법

한계·조건

Comments