News·2일 전
미국 정부, Anthropic 에 Claude Fable·Mythos 강제 차단 — 취약점 발견 계기

미국 정부가 Anthropic 에게 Claude Fable 과 Mythos 에 대한 모든 접근을 차단하도록 강제했습니다. 특정 jailbreak 가 발견된 것이 계기였으나, Anthropic 은 이를 사전에 경고한 바 있으며 GPT-5.5 도 동일한 출력을 문제없이 생성할 수 있다고 주장합니다. 정부가 요구한 수정 범위가 좁은지 전면적인지 불확실하며, 이번 조치가 AI 규제의 혼선을 보여준다는 평가가 나옵니다.
금요일 저녁, 미국 정부가 Anthropic 에게 Claude Fable 과 Mythos 의 모든 접근을 차단하도록 강제했습니다.
골자
- 조치 — 미국 정부가 Anthropic 에게 Claude Fable 과 Mythos 의 모든 접근을 차단하도록 강제했습니다.
- 계기 — 특정 jailbreak 가 발견되었으나, Anthropic 은 이를 사전에 경고한 바 있으며 GPT-5.5 도 동일한 출력을 문제없이 생성할 수 있다고 주장합니다.
- 강제 — Anthropic 이 자발적으로 차단하지 않자, 정부는 수출 제한 조치를 통해 전 세계적으로 서비스를 중단시켰습니다.
배경·맥락
- Anthropic CEO Dario Amodei 가 정부에 '해결할 문제가 없다'고 설명했으나 받아들여지지 않았습니다.
- Dean W. Ball 은 이번 조치가 '세상을 더 어리석게 만든다'고 비판하며, 정부가 AI 모델의 성능과 취약점을 오해하고 있다고 지적했습니다.
향후 전망
- 수정 범위 — 좁은 수정(narrow fix)은 가능하지만, 전면 수정(global fix)은 사실상 불가능할 것으로 보입니다.
- 불확실성 — 정부의 동기, AI에 대한 이해도, 다음 조치 등이 여전히 불투명한 상황입니다.
편집자 한 줄
이번 사례는 규제 기관이 최신 AI 모델의 실제 위험을 과대평가하거나 오해할 때 발생할 수 있는 혼선을 잘 보여줍니다.
- #anthropic
- #claude
- #regulation
- #jailbreak
- #us-government
LessWrong