Papers·5일 전
InKH: 금융 LLM 에이전트의 맥락 복잡성을 흡수하는 아키텍처 — 지연시간 83%·토큰 비용 82%·오래된 지식 사용 97% 감소

INC4 팀이 금융 LLM 에이전트의 맥락 유지 문제를 해결하는 InKH(Interaction-native Knowledge Harness) 아키텍처를 제안했습니다. 사용자·시장·포트폴리오·도구 이벤트를 구조화된 지식으로 변환해, 수동 주입 없이 작업 맥락을 자동으로 구성합니다. 합성 벤치마크(46,080 평가)에서 평균 태스크 품질 0.815, 지연시간 900ms로, 에이전트 기반 위키워크 대비 지연시간 83%, 토큰 비용 82%, 오래된 지식 사용 97%를 줄였습니다. 다만 실시간 트레이딩 성능이 아닌 아키텍처 수준의 검증이라는 한계가 있습니다.
금융 AI 에이전트가 실패하는 흔한 이유는 사용자가 복잡성을 떠안게 하기 때문입니다. InKH는 그 복잡성을 시스템이 흡수합니다.
핵심 결론
- 벤치마크 — 합성 벤치마크(24 시드, 4 라운드, 80 에피소드/라운드, 6 베이스라인)에서 46,080 조건부 평가 수행.
- 성능 — 평균 태스크 품질 0.815, 지연시간 900ms 달성. 에이전트 기반 위키워크 메모리 대비 지연시간 82.95%, 토큰 비용 82.29%, 오래된 지식 사용 96.58% 감소.
- 품질·추적성 — 품질 0.108, 추적성 0.461 향상. 무효화 없는 시간 그래프 시스템 대비 품질 0.050 향상, 오래된 메모리 사용 96.58% 감소.
방법
- 수동 지식 주입 — 사용자·시장·포트폴리오·도구 이벤트를 구조화된 운영 지식으로 변환해, 메인 모델 단계 전에 제한된 작업 컨텍스트 버퍼를 조립합니다.
- 시간 그래프 메모리 — 저지연 검색을 위한 시간 그래프 메모리로, 과거 상호작용과 시장 데이터를 효율적으로 연결합니다.
- 위키 감사 표면 — 사람이 읽을 수 있는 거버넌스를 위한 위키 감사 표면을 제공해 추적성과 감사 가능성을 높입니다.
- 배경 추출 — 성숙도·감쇠·쓰기 시점 무효화를 포함한 배경 추출로 오래된 지식 사용을 최소화합니다.
한계·조건
- 벤치 범위 — 합성 벤치마크 기반으로, 실시간 트레이딩 성능이 아닌 아키텍처 수준의 행동 검증입니다.
- 재현성 — 통제된 합성 환경에서 평가되어 실제 금융 데이터의 노이즈와 변동성을 완전히 반영하지 못할 수 있습니다.
- 코드 공개 — 코드 공개 여부는 명시되지 않았습니다.
편집자 한 줄
금융 도메인에서 에이전트의 맥락 유지 문제를 시스템 설계로 해결하려는 시도가 인상적입니다. 다만 합성 벤치마크의 현실 적용 가능성은 추가 검증이 필요해 보입니다.
- #llm-agent
- #finance
- #memory
- #architecture
- #inc4
INC4