Papers·1주 전
SFT가 유발하는 환각, 자기-증류와 파라미터 동결로 완화 — 지속학습 접근법

SFT가 새로운 사실을 학습할 때 사전학습 지식이 붕괴되면서 환각이 증가하는 문제를 지속학습 기법으로 해결한 연구입니다. 출력 분포 드리프트를 규제하는 자기-증류 기반 SFT를 제안했고, 새 지식이 필요 없는 경우 파라미터 그룹을 동결하는 방식도 효과적임을 보였습니다. 실험 결과, 환각의 주된 원인은 의미 표현 간 간섭이며 자기-증류가 이 간섭을 완화한다는 메커니즘을 밝혔습니다.
- #hallucination
- #continual-learning
- #self-distillation
- #sft
Guy Kaplan