News·1개월 전

Anthropic, 생명과학·사이버 보안 쿼리 차단 강화 — Fable 출시

Anthropic 이 생명과학·사이버 보안 분야 쿼리에 대해 더 엄격한 안전장치를 적용한 모델 변형 Fable 을 출시했습니다. 무해한 질문도 광범위하게 차단하고 Opus 4.8 로 우회시키는 방식인데, 일부 사용자들은 과도한 제한이라고 우려합니다. Anthropic 은 능력 확산 속도를 늦추는 것이 필요하다는 입장입니다.

Anthropic 이 생명과학·사이버 보안 쿼리를 광범위하게 차단하는 Fable 을 내놓으며 안전 정책을 강화했습니다.

골자

모델 — Anthropic 의 mythos 변형 Fable — 생명과학·사이버 보안 쿼리에 대해 더 엄격한 안전장치 적용.
차단 방식 — 무기화 가능한 소수 질문만 걸러내는 대신, '생물학이란 무엇인가' 같은 기본 질문까지 광범위하게 차단하고 Opus 4.8 로 우회.
반응 — 일부 사용자들은 과도한 제한에 우려를 표했으나, Anthropic 은 능력 확산 속도를 늦추는 것이 중요하다는 입장.

배경·맥락

Opus 4.8 은 지난주 기준 세계에서 가장 강력한 AI 모델 중 하나였습니다.
Anthropic 은 안전 정책의 트레이드오프를 인정하면서도, 시간을 벌기 위해 통제된 접근이 필요하다고 설명.

편집자 노트

원문은 총기 규제를 비유한 우화로 안전 정책을 옹호하는 쪽입니다. 무해한 사용자에게 불편을 주더라도 악의적 사용을 늦추는 게 낫다는 논지인데, 실제로 이런 광범위한 차단이 연구 커뮤니티에 얼마나 영향을 줄지 지켜볼 만합니다.

편집자 한 줄

원문의 우화는 총기 규제 비유로, 안전 정책의 트레이드오프를 극단적으로 보여주지만 실제 정책의 영향은 더 미묘할 수 있습니다.

#anthropic
#safety
#fable
#cyber
#biology

LessWrong

원문 보기 →

Anthropic, 생명과학·사이버 보안 쿼리 차단 강화 — Fable 출시

골자

배경·맥락

편집자 노트

Comments