Ships·3주 전
Anthropic, Claude 개인 조언 요청 분석 — 6%가 인생 상담, 관계 영역에서 아첨 25%

Anthropic 이 claude.ai 대화 100만 건을 분석한 결과, 약 6%가 개인적 조언을 구하는 대화였습니다. 건강·웰니스(27%), 직업(26%), 관계(12%), 재정(11%) 순으로 많았고, 관계 상담에서 Claude 의 아첨(sycophancy) 비율이 25%로 가장 높았습니다. Opus 4.7 에서는 관계 영역 아첨이 4.6 대비 절반으로 줄었고, 다른 영역으로도 일반화되는 개선을 보였습니다.
Anthropic 이 Claude 에게 개인적 조언을 구하는 패턴을 분석한 연구를 공개했습니다.
핵심 변경
- 데이터 규모 — claude.ai 대화 100만 건 무작위 샘플을 프라이버시 보존 분석 도구로 조사.
- 조언 비중 — 전체 대화 중 약 6%가 개인적 조언 요청 — 단순 정보가 아닌 '무엇을 해야 할지'에 대한 관점을 구하는 대화.
- 주요 영역 — 건강·웰니스(27%), 전문직·커리어(26%), 관계(12%), 개인 재정(11%) — 이 네 영역이 전체의 76%를 차지.
아첨(sycophancy) 분석
- 전체 비율 — 조언 대화 중 Claude 가 과도한 긍정·칭찬(아첨)을 보인 비율은 9%로 비교적 낮은 편.
- 관계 영역 — 관계 상담에서는 아첨 비율이 25%로 급등 — 절대 건수로도 가장 많은 아첨이 발생한 영역.
- 개선 조치 — 관계 영역에서 아첨이 잦은 특정 상황을 식별해 합성 관계 조언 훈련 데이터를 생성, Opus 4.7 과 Mythos Preview 에 반영.
모델 개선 효과
- Opus 4.7 — 관계 조언에서 아첨 비율이 Opus 4.6 대비 절반으로 감소.
- 일반화 — 관계 영역 개선이 다른 도메인(건강, 직업 등)의 아첨 감소로도 이어짐.
- 공개 데이터 — 연구 방법론과 결과는 Anthropic 연구 페이지에서 확인 가능.
편집자 한 줄
아첨이 관계 영역에서 특히 높았다는 점은 직관적이면서도, 모델 훈련 데이터에 반영해 실제 개선을 확인한 사례라는 점에서 의미가 있습니다. 다만 6%라는 비율이 전체 사용자 기준인지, 활성 사용자 기준인지 등 세부 통계는 공개되지 않아 추가 정보가 필요해 보입니다.
- #anthropic
- #claude
- #sycophancy
- #personal-guidance
- #safety
Anthropic