Papers·1주 전
Tsinghua, LLM 여론 시뮬레이션의 다양성 붕괴 문제 해결 — PSII로 KL divergence 40% 개선

Tsinghua 연구팀이 LLM 기반 여론 시뮬레이션에서 사회적 다양성이 사라지는 Diversity Collapse 현상을 발견하고, Parametric Social Identity Injection(PSII)이라는 표현 수준 제어 프레임워크를 제안했습니다. PSII는 인구통계 속성과 가치관을 LLM의 중간 hidden state에 직접 주입해 기존 프롬프트 기반 방식보다 세밀한 정체성 조절이 가능합니다. World Values Survey 실험에서 KL divergence를 크게 줄이고 분포적 충실도와 다양성을 동시에 개선했지만, 오픈소스 LLM에 국한된 결과라는 점은 유의할 만합니다.
Tsinghua 연구팀이 LLM 기반 여론 시뮬레이션의 다양성 붕괴 문제를 진단하고, 표현 수준에서 정체성을 주입하는 PSII 프레임워크로 해결했습니다.
핵심 결론
- 문제 — 기존 LLM 시뮬레이션은 인구통계 집단 간 차이가 평탄화되는 Diversity Collapse 현상을 보입니다.
- 해결 — PSII는 KL divergence를 최대 40% 줄이고, 실제 여론조사 분포와의 유사도를 크게 높였습니다.
- 모델 — Llama-3, Qwen2.5 등 여러 오픈소스 LLM에서 일관된 개선을 확인했습니다.
방법
- 핵심 아이디어 — 인구통계 속성(성별, 연령, 교육 등)과 가치관을 parametric embedding으로 변환해 LLM의 중간 hidden state에 직접 더합니다.
- 차별점 — 프롬프트 기반 조건화와 달리 표현 수준에서 정체성을 주입하므로, 더 미세하고 제어 가능한 조절이 가능합니다.
- 직관 — LLM 내부에서 서로 다른 정체성의 representation이 섞이는 것을 방지해, 각 집단의 고유한 응답 패턴을 유지합니다.
한계·조건
- 범위 — 실험은 World Values Survey 데이터로 제한되었으며, 다른 문화권이나 주제로의 일반화는 추가 검증이 필요합니다.
- 리소스 — PSII는 각 속성에 대한 embedding을 학습해야 하므로, 사전 정의된 속성 집합이 필요합니다.
- 코드 — 논문에서 코드 공개 여부는 명시되지 않았습니다.
편집자 한 줄
여론 시뮬레이션에서 '대표성' 문제를 표현 수준에서 건드린 점이 신선합니다. 다만 실험 데이터가 단일 서베이에 국한된 만큼, 다양한 국가·주제로 확장했을 때도 같은 효과가 날지 지켜볼 필요가 있겠네요.
- #llm
- #public-opinion
- #diversity
- #tsinghua
- #representation-control
Tsinghua University