Papers·1개월 전

STRIDE: 학습 데이터 영향 추적을 활성 공간으로 전환 — 기존 대비 13배 빠른 TDA

Rishit Dagli 연구진이 LLM 사전학습 데이터 귀속(TDA)을 위해 활성 공간에서 희소 복원 문제로 접근하는 STRIDE를 제안했습니다. 기존 파라미터 공간 기반 방법 대신 경량 '스티어링 연산자'로 데이터 서브셋의 기능적 영향을 모방하고, 희소 선형 분해를 통해 개별 예제의 영향을 복원합니다. SOTA 달성에 13배 빠른 속도를 보였으며, 데이터 선택·오염 분석 등에 활용 가능합니다. 단, 이 방법은 사전학습 단계에 특화되어 있어 파인튜닝 시나리오에서의 일반화는 추가 검증이 필요합니다.

LLM 학습 데이터 귀속(TDA)을 활성 공간에서 희소 복원 문제로 풀어 기존 대비 13배 빠르면서도 SOTA를 달성한 STRIDE가 공개되었습니다.

핵심 결론

성능 — LLM 사전학습 TDA 벤치마크에서 기존 방법 대비 13배 빠른 속도로 SOTA를 기록했습니다.
적용 — 데이터 선택, 데이터 오염 탐지, 질적 분석 등 하류 작업에서 실용성을 입증했습니다.

방법

핵심 아이디어 — 파라미터 변화를 추정하는 대신, 데이터 서브셋으로 인한 모델의 기능적 변화를 활성 공간에서 모델링합니다.
프레임워크 — 경량 '스티어링 연산자'를 학습해 데이터 서브셋의 행동 변화를 흉내내고, 희소 선형 분해로 개별 예제 영향을 복원합니다.
압축 센싱(compressive sensing) 관점에서 희소 복원 문제로 정식화한 점이 독특합니다.

한계·조건

범위 — 사전학습 단계에 특화되어 있으며, 파인튜닝 시나리오에서의 일반화는 추가 검증이 필요합니다.
코드 — 현재 코드 공개 여부는 확인되지 않았습니다.

편집자 한 줄

활성 공간으로의 전환은 계산 효율성과 직관성 모두에서 매력적인 방향입니다. 다만 희소성 가정이 항상 성립할지는 후속 연구가 필요해 보입니다.

#training-data-attribution
#llm
#interpretability
#sparse-recovery
#steering

Rishit Dagli

원문 보기 →

STRIDE: 학습 데이터 영향 추적을 활성 공간으로 전환 — 기존 대비 13배 빠른 TDA

핵심 결론

방법

한계·조건

Comments