Papers·3일 전
ClinSeekAgent: 능동적 증거 탐색으로 임상 결정 지원 — Claude Opus 4.6 멀티모달 F1 47.5→62.6

UCSC-VLAA 팀이 ClinSeekAgent를 공개했습니다. 기존 임상 AI는 미리 선별된 증거만 사용하지만, 이 프레임워크는 에이전트가 직접 의학 지식베이스, EHR, 영상 도구를 탐색하며 증거를 수집하고 가설을 수정합니다. 텍스트 EHR 태스크에서 Claude Opus 4.6의 F1을 60.0→63.2로, MiniMax M2.5를 43.1→47.3으로 개선했고, 멀티모달(CXR)에서는 Claude Opus 4.6이 47.5→62.6(+15.1)으로 크게 향상됐습니다. 또한 증적 탐색 궤적을 증류한 ClinSeek-35B-A3B는 AgentEHR-Bench에서 34.0 F1을 기록해 Qwen3.5-35B-A3B 대비 +11.9점을 달성했습니다. 다만 벤치마크 특화 평가이며 실제 임상 적용에는 추가 검증이 필요합니다.
- #clinical-decision-support
- #agentic-framework
- #multimodal
- #ucsc-vlaa
UCSC-VLAA