← Back to feed
News·4시간 전

위키피디아 편집으로 LLM 가치관에 영향 — 소규모 캠페인도 유의미한 변화

위키피디아 편집으로 LLM 가치관에 영향 — 소규모 캠페인도 유의미한 변화

동물복지 옹호 단체 PAW(Pro-Animal Wikipedians)가 위키피디아 문서를 전략적으로 편집해 LLM의 관련 주제 응답을 유의미하게 바꿨다는 연구 결과가 나왔습니다. 115개 페이지에 125건의 편집을 적용한 후 세 가지 실험에서 모델 출력이 측정 가능하게 변화했는데, 소규모 편집 캠페인도 LLM 훈련 데이터 내 위키피디아 비중이 높아 효과를 낼 수 있음을 보여줍니다.

위키피디아 편집이 LLM의 가치관에 미치는 영향을 실험한 연구가 나왔습니다.

골자

  • 연구Brazilek et al. (2026)이 위키피디아 편집을 통한 LLM 가치관 조작 가능성을 실험.
  • 대상동물복지 옹호 그룹 PAW의 115개 페이지, 125건 편집을 샘플로 사용.
  • 결과세 가지 실험에서 LLM 출력이 편집 방향으로 유의미하게 이동.

배경·맥락

  • LLM 훈련 데이터에서 위키피디아는 높은 가중치를 차지 (The Pile, RedPajama, Dolma 등).
  • 위키피디아의 민주적 편집 모델 덕분에 소규모 조직도 접근 가능.
  • 선행 연구데이터 중독(data poisoning) 공격은 기존에 알려졌으나, 실제 옹호 단체의 일상적 편집 효과를 측정한 첫 사례.

자금 용처·향후

  • 시사점옹호 단체가 저비용으로 AI 시스템에 영향을 줄 수 있는 실용적 경로가 확인됨.
  • 한계실험은 특정 모델(공개되지 않음)과 주제(동물복지)에 국한, 일반화에는 추가 연구 필요.

편집자 한 줄

위키피디아 편집이 LLM 출력에 미치는 영향을 실증한 점은 의미 있지만, 편집의 진위성과 장기적 영향은 아직 검증되지 않았습니다.

  • #llm
  • #wikipedia
  • #data-poisoning
  • #advocacy
  • #animal-welfare
LessWrong
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —