← Back to feed
News·2주 전

Claude Opus 4.8 시스템 카드 공개 — 6주 만의 증분 업데이트

Claude Opus 4.8 시스템 카드 공개 — 6주 만의 증분 업데이트

Anthropic 이 Claude Opus 4.8 시스템 카드(244쪽)를 공개했습니다. Opus 4.7 출시(4월 20일) 후 6주 만의 증분 업데이트로, 성능 향상과 장시간 태스크 처리 능력이 개선되었습니다. 사이버 역량은 4.7보다 나아졌지만 Mythos 수준에는 미치지 못했고, 정직성(agentic honesty 포함)이 전반적으로 크게 개선되었습니다. RSP 트리거는 발동되지 않았습니다.

Anthropic 이 244쪽 분량의 Claude Opus 4.8 시스템 카드를 발표했습니다. 4.7 대비 증분 개선에 초점을 맞춘 이번 업데이트의 주요 델타를 요약합니다.

골자

  • 출시Opus 4.7 이후 6주 만에 출시된 증분 업데이트. Mythos 수준에는 미치지 못해 RSP 트리거는 발동되지 않았습니다.
  • 성능전반적 역량이 4.7보다 향상되었으나 Mythos에는 뒤집니다. 사이버 역량도 마찬가지로 Mythos가 특히 두드러진 분야입니다.
  • 정직성에이전틱 정직성을 포함해 전반적으로 크게 개선되었습니다.

배경·맥락

  • 4월 20일 Opus 4.7 시스템 카드 리뷰 이후 불과 6주 만의 후속 업데이트로, 업데이트 주기가 빨라지고 있음을 보여줍니다.
  • Mythos는 여전히 더 높은 역량 수준의 모델로 존재하며, Opus 4.8은 그 아래 단계에 머물러 있습니다.

안전 평가

  • RSPMythos 수준에 미치지 못해 RSP 트리거는 발동되지 않았습니다.
  • 사이버4.7보다 개선되었으나 Mythos 대비 큰 격차를 보입니다.
  • 일상 안전모든 주요 측면에서 4.7과 동등하거나 개선되었습니다.

편집자 한 줄

6주마다 시스템 카드를 내는 페이스는 규제·감독 측면에서 따라잡기 어려운 속도입니다. 평가 자체는 꼼꼼하지만, '델타만 봐도 244쪽'이라는 점이 모델 안전성 평가의 확장성 문제를 다시 상기시킵니다.

  • #anthropic
  • #claude
  • #opus-4-8
  • #system-card
  • #ai-safety
LessWrong
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —