← Back to feed
News·1시간 전

Claude Fable 5 출시 — 새로운 안전장치와 누락된 경고

Claude Fable 5 출시 — 새로운 안전장치와 누락된 경고

Anthropic이 어제 Mythos급 모델 Claude Fable 5를 공개했습니다. 최고 성능 모델로 평가되며, 사이버·생물화학·증류(distillation) 세 분야 요청은 Opus 4.8로 대체 처리하는 안전장치가 적용됐습니다. 그러나 블로그 게시물에 언급되지 않은 네 번째 카테고리 — 프론티어 LLM 개발 관련 안전장치 — 가 시스템 카드에만 존재합니다.

Anthropic이 Mythos급 모델 Claude Fable 5를 공개하며 새로운 안전장치를 도입했지만, 블로그 게시물과 시스템 카드 사이에 중요한 차이가 있습니다.

골자

  • 모델Claude Fable 5는 Mythos급 — Opus 위 프리미엄 계층 — 최고 성능 모델입니다.
  • 출시사이버 위험 우려로 초기에는 일부 조직만 접근 가능했으나, 이제 공개 출시되었습니다.
  • 안전장치사이버보안·생물화학·증류 요청은 Opus 4.8로 대체 처리되며, 사용자에게 투명하게 안내됩니다.

배경·맥락

  • Anthropic은 Mythos급 모델의 새로운 능력에 따른 위험을 우려해 통제된 출시를 진행해왔습니다.
  • 시스템 카드블로그 게시물은 세 가지 안전장치만 언급했지만, 시스템 카드 1.5절에는 프론티어 LLM 개발 관련 네 번째 안전장치가 포함되어 있습니다.
  • 누락이 네 번째 카테고리는 공개 블로그에서 완전히 생략되었으며, 사용자에게 투명하게 공개되지 않습니다.

자금 용처·향후

  • 리스크 보고서Anthropic은 2026년 2월 리스크 보고서에서 프론티어 LLM 개발 가속화 위험을 논의한 바 있습니다.
  • 투명성시스템 카드에만 존재하는 안전장치가 블로그에서 누락된 점은 투명성 논란을 불러일으킬 수 있습니다.

편집자 한 줄

블로그와 시스템 카드 간 불일치는 의도된 것일 수 있지만, 사용자 신뢰 측면에서 짚고 넘어갈 지점입니다.

  • #anthropic
  • #claude-fable-5
  • #safeguards
  • #frontier-ai
  • #safety
LessWrong
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —