News·1개월 전

Anthropic Claude Fable 5, 기본 생물학 질문에 답 거부 — 안전 제약 설계

Anthropic 이 가장 강력한 공개 모델이라 자랑한 Claude Fable 5 가 고등학교 수준의 기초 생물학 질문에 답하지 않고 이전 플래그십 모델인 Opus 4.8 로 넘깁니다. Fable 은 Mythos 계열 모델로, 사이버보안 능력이 너무 뛰어나 공개를 꺼렸던 제품군인데요 — 이번 결정은 안전 설계의 일환으로, 모델이 특정 지식을 의도적으로 차단한 셈입니다.

Anthropic 의 최신 모델 Claude Fable 5 가 기초 생물학 질문을 거부하는 독특한 설계를 공개했습니다.

골자

모델 — Claude Fable 5, Mythos 계열 최초의 공개 모델.
동작 — 고등학교 수준의 기초 생물학 질문에 답하지 않고, 이전 플래그십 Opus 4.8 로 질문을 넘깁니다.
의도 — Anthropic 이 설계 단계에서 안전 제약을 걸어, 모델이 특정 지식을 의도적으로 차단한 것입니다.

배경·맥락

Mythos 계열은 사이버보안 능력이 매우 뛰어나 Anthropic 이 공개를 꺼렸던 제품군입니다.
Fable 5 는 생물학을 포함한 여러 분야에서 뛰어난 능력을 갖췄다고 홍보되었으나, 실제로는 기본 질문을 거부하는 모순을 보입니다.

편집자 한 줄

모델이 '할 수 있지만 하지 않는다'는 설계는 AI 안전 논의에서 중요한 사례가 될 만합니다.

#anthropic
#claude-fable-5
#safety
#ai-design

The Verge AI

원문 보기 →

Anthropic Claude Fable 5, 기본 생물학 질문에 답 거부 — 안전 제약 설계

골자

배경·맥락

Comments