← Back to feed
Papers·어제

STRIDE: 학습 데이터 영향 추적을 활성 공간으로 전환 — 기존 대비 13배 빠른 TDA

STRIDE: 학습 데이터 영향 추적을 활성 공간으로 전환 — 기존 대비 13배 빠른 TDA

Rishit Dagli 연구진이 LLM 사전학습 데이터 귀속(TDA)을 위해 활성 공간에서 희소 복원 문제로 접근하는 STRIDE를 제안했습니다. 기존 파라미터 공간 기반 방법 대신 경량 '스티어링 연산자'로 데이터 서브셋의 기능적 영향을 모방하고, 희소 선형 분해를 통해 개별 예제의 영향을 복원합니다. SOTA 달성에 13배 빠른 속도를 보였으며, 데이터 선택·오염 분석 등에 활용 가능합니다. 단, 이 방법은 사전학습 단계에 특화되어 있어 파인튜닝 시나리오에서의 일반화는 추가 검증이 필요합니다.

LLM 학습 데이터 귀속(TDA)을 활성 공간에서 희소 복원 문제로 풀어 기존 대비 13배 빠르면서도 SOTA를 달성한 STRIDE가 공개되었습니다.

핵심 결론

  • 성능LLM 사전학습 TDA 벤치마크에서 기존 방법 대비 13배 빠른 속도로 SOTA를 기록했습니다.
  • 적용데이터 선택, 데이터 오염 탐지, 질적 분석 등 하류 작업에서 실용성을 입증했습니다.

방법

  • 핵심 아이디어파라미터 변화를 추정하는 대신, 데이터 서브셋으로 인한 모델의 기능적 변화를 활성 공간에서 모델링합니다.
  • 프레임워크경량 '스티어링 연산자'를 학습해 데이터 서브셋의 행동 변화를 흉내내고, 희소 선형 분해로 개별 예제 영향을 복원합니다.
  • 압축 센싱(compressive sensing) 관점에서 희소 복원 문제로 정식화한 점이 독특합니다.

한계·조건

  • 범위사전학습 단계에 특화되어 있으며, 파인튜닝 시나리오에서의 일반화는 추가 검증이 필요합니다.
  • 코드현재 코드 공개 여부는 확인되지 않았습니다.

편집자 한 줄

활성 공간으로의 전환은 계산 효율성과 직관성 모두에서 매력적인 방향입니다. 다만 희소성 가정이 항상 성립할지는 후속 연구가 필요해 보입니다.

  • #training-data-attribution
  • #llm
  • #interpretability
  • #sparse-recovery
  • #steering
Rishit Dagli
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —