Papers·3일 전
PaperFlow: 종단형 학술 논문 추천 프레임워크 — 프로파일링·추천·적응 3단계로 일일 스트림 50개 처리

OpenDataLab 팀이 학술 논문 추천을 고정 후보군에 대한 정적 랭킹이 아닌, 일별 관심 변화와 피드백 누적을 반영하는 종단형(longitudinal) 프레임워크 PaperFlow를 제안했습니다. Profiling(이질적 콜드스타트 증거로 구조화된 프로파일 구축), Recommending(고정 디스플레이 예산 아래 다중 신호 집계로 일별 스트림 랭킹), Adapting(의미적으로 구분된 피드백 신호로 사용자 상태 갱신 및 관심 표류 모델링)의 세 단계로 구성되며, 24명의 시뮬레이션 연구자, 50개 일일 스트림, 1,200개 에피소드, 20,727개 논문, 497,448개 레코드로 구성된 종단형 벤치마크를 함께 공개했습니다. 5개 기준선 대비 오라클 기반 랭킹, 시뮬레이션 선택 행동 정합도, 블라인드 인간 평가에서 최고 성능을 기록했습니다.
OpenDataLab 팀이 학술 논문 추천을 일별 관심 변화와 피드백 누적을 반영하는 종단형 프레임워크 PaperFlow를 제안했습니다.
핵심 결론
- 태스크 — 일별 논문 스트림 추천 — 고정 후보군이 아닌 시간에 따라 변화하는 사용자 관심과 피드백을 반영.
- 벤치마크 — 24명 시뮬레이션 사용자, 50개 일일 스트림, 1,200개 에피소드, 20,727개 논문, 497,448개 레코드로 구성된 종단형 벤치마크를 구축.
- 성능 — 5개 기준선 대비 오라클 기반 랭킹, 시뮬레이션 선택 행동 정합도, 블라인드 인간 평가에서 최고 점수.
방법
- 3단계 구조 — Profiling(이질적 증거로 구조화된 프로파일 유지), Recommending(다중 신호 집계 + 고정 디스플레이 예산), Adapting(피드백 신호로 상태 갱신 + 관심 표류 모델링).
- 프로파일은 검사 가능(inspectable)하도록 설계되어 사용자 모델의 투명성을 확보했습니다.
- 블라인드 인간 평가 프로토콜을 별도로 정의하여 자동 메트릭과 전문가 판단 간 정합성을 검증합니다.
한계·조건
- 시뮬레이션 기반 — 벤치마크는 시뮬레이션 사용자와 레이블에 의존하므로 실제 사용자 행동과의 괴리가 있을 수 있습니다.
- 공개 여부 — 코드 및 데이터 공개 여부는 논문에 명시되지 않았습니다.
편집자 한 줄
종단형 추천 벤치마크 자체가 드문 상황에서 공개된 데이터셋과 프로토콜은 후속 연구에 유용할 만합니다.
- #paperflow
- #recommendation
- #longitudinal
- #opendatalab
- #academic-search
OpenDataLab