Papers·1개월 전

MemReread: 선형 시간 복잡도로 장문 추론 성능 개선 — 재독 전략과 강화학습 결합

Soochow University 연구진이 장문 추론에서 선형 시간 복잡도를 유지하면서도 성능을 높이는 MemReread 프레임워크를 제안했습니다. 기존 에이전트 메모리 방식은 문서를 순차 처리하며 메모리를 덮어쓰는데, 이때 손실된 증거를 검색으로 복구하려 했으나 검색 자체의 간섭 문제가 있었습니다. MemReread는 최종 메모리가 불충분할 때 질문 분해와 재독을 트리거해 중간 검색 없이 간접 사실을 복구하며, 강화학습으로 재독 횟수와 길이 외삽을 동적으로 제어합니다. 다양한 벤치마크에서 기선 대비 일관된 성능 향상을 보였고, 문맥 길이에 선형인 복잡도를 유지합니다.

#long-context
#reasoning
#memory
#reinforcement-learning
#soochow-university

Soochow University

원문 보기 →

MemReread: 선형 시간 복잡도로 장문 추론 성능 개선 — 재독 전략과 강화학습 결합

Comments