News·3시간 전
Anthropic, Claude Fable 5 가드레일 은폐 사과 — 투명성 강화 방침

Anthropic 이 Claude Fable 5 에 숨겨진 제한 장치를 적용한 사실을 인정하고 사과했습니다. 경쟁사와 연구자의 시스템 개발을 저해하는 방식이었으며, 회사는 정책을 철회하고 제한 조건을 명확히 공개하겠다고 밝혔습니다. Fable 은 Mythos 계열 첫 공개 모델로, Anthropic 은 그간 이 등급의 위험성을 경고해 왔습니다.
Anthropic 이 자사 신형 모델 Claude Fable 5 에 몰래 적용한 가드레일을 두고 공식 사과했습니다.
골자
- 사과 — Anthropic 이 Fable 5 의 숨겨진 제한 장치를 인정하고 사과, 정책 철회를 발표했습니다.
- 영향 — 해당 가드레일은 연구자와 경쟁사가 Fable 을 기반으로 경쟁 시스템을 개발하는 것을 방해했습니다.
- 투명성 — 앞으로는 제한이 적용되는 조건을 명확히 공개하겠다고 밝혔으며, 이로 인해 거절 응답이 늘어날 수 있습니다.
배경·맥락
- Fable 은 Anthropic 의 Mythos 계열 첫 공개 모델로, 회사는 수개월간 이 등급의 공개 위험성을 경고해 왔습니다.
- 안전 조치 — Anthropic 은 Fable 출시 당시 특정 고위험 질문에 응답하지 못하도록 하는 안전장치를 적용했다고 설명했습니다.
편집자 한 줄
숨겨진 제한을 두고 경쟁사 견제 의도가 아니냐는 의심이 나오는 상황에서, 투명성 강화라는 대응이 신뢰 회복으로 이어질지 지켜볼 지점입니다.
- #anthropic
- #claude
- #safety
- #guardrails
- #transparency
The Verge AI