Hypes·2주 전
Anthropic 새 연구 Model Spec Midtraining — AI에 '일반화 방식'을 가르친다
Anthropic이 Model Spec Midtraining(MSM)이라는 정렬 연구를 공개했습니다. 기존 방식은 원하는 행동의 예시를 보여주지만 새로운 상황에서 일반화에 실패할 수 있는데, MSM은 AI에게 '어떻게 일반화할지'와 '그 이유'를 먼저 가르치는 접근입니다. 정렬 연구의 방향성을 보여주는 신호로, 추후 구체적인 결과물이 나올지 지켜볼 만합니다.
- #anthropic
- #alignment
- #model-spec
- #research
Anthropic@AnthropicAI