News·4시간 전

위키피디아 편집으로 LLM 가치관에 영향 — 소규모 캠페인도 유의미한 변화

동물복지 옹호 단체 PAW(Pro-Animal Wikipedians)가 위키피디아 문서를 전략적으로 편집해 LLM의 관련 주제 응답을 유의미하게 바꿨다는 연구 결과가 나왔습니다. 115개 페이지에 125건의 편집을 적용한 후 세 가지 실험에서 모델 출력이 측정 가능하게 변화했는데, 소규모 편집 캠페인도 LLM 훈련 데이터 내 위키피디아 비중이 높아 효과를 낼 수 있음을 보여줍니다.

위키피디아 편집이 LLM의 가치관에 미치는 영향을 실험한 연구가 나왔습니다.

골자

연구 — Brazilek et al. (2026)이 위키피디아 편집을 통한 LLM 가치관 조작 가능성을 실험.
대상 — 동물복지 옹호 그룹 PAW의 115개 페이지, 125건 편집을 샘플로 사용.
결과 — 세 가지 실험에서 LLM 출력이 편집 방향으로 유의미하게 이동.

배경·맥락

LLM 훈련 데이터에서 위키피디아는 높은 가중치를 차지 (The Pile, RedPajama, Dolma 등).
위키피디아의 민주적 편집 모델 덕분에 소규모 조직도 접근 가능.
선행 연구 — 데이터 중독(data poisoning) 공격은 기존에 알려졌으나, 실제 옹호 단체의 일상적 편집 효과를 측정한 첫 사례.

자금 용처·향후

시사점 — 옹호 단체가 저비용으로 AI 시스템에 영향을 줄 수 있는 실용적 경로가 확인됨.
한계 — 실험은 특정 모델(공개되지 않음)과 주제(동물복지)에 국한, 일반화에는 추가 연구 필요.

편집자 한 줄

위키피디아 편집이 LLM 출력에 미치는 영향을 실증한 점은 의미 있지만, 편집의 진위성과 장기적 영향은 아직 검증되지 않았습니다.

#llm
#wikipedia
#data-poisoning
#advocacy
#animal-welfare

LessWrong

원문 보기 →

위키피디아 편집으로 LLM 가치관에 영향 — 소규모 캠페인도 유의미한 변화

골자

배경·맥락

자금 용처·향후

Comments