← Back to feed
Hypes·2주 전

Anthropic 새 연구 Model Spec Midtraining — AI에 '일반화 방식'을 가르친다

Anthropic이 Model Spec Midtraining(MSM)이라는 정렬 연구를 공개했습니다. 기존 방식은 원하는 행동의 예시를 보여주지만 새로운 상황에서 일반화에 실패할 수 있는데, MSM은 AI에게 '어떻게 일반화할지'와 '그 이유'를 먼저 가르치는 접근입니다. 정렬 연구의 방향성을 보여주는 신호로, 추후 구체적인 결과물이 나올지 지켜볼 만합니다.

  • #anthropic
  • #alignment
  • #model-spec
  • #research
Anthropic
Anthropic@AnthropicAI
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —