Ships·3시간 전
Anthropic, AI 에이전트 자율성 실측 연구 공개 — Claude Code 자율 작업 시간 45분 이상으로 증가

Anthropic 이 Claude Code 및 API 데이터를 분석한 연구에서, AI 에이전트의 실제 자율성 수준을 측정했습니다. Claude Code 의 연속 작업 시간이 3개월 만에 25분에서 45분 이상으로 거의 두 배 증가했고, 숙련 사용자는 더 자주 자동 승인(auto-approve)을 사용하지만 개입 빈도는 오히려 늘어나는 패턴을 보였습니다. 소프트웨어 엔지니어링이 에이전트 활동의 약 50%를 차지했고, 의료·금융 등 고위험 도메인에서도 소규모 사용이 확인됐습니다.
Anthropic 이 Claude Code 와 API 데이터를 바탕으로 AI 에이전트의 실제 자율성과 사용 패턴을 실측한 연구를 발표했습니다.
핵심 발견
- 자율 작업 시간 — Claude Code 의 가장 긴 연속 작업 시간이 3개월 전 25분 미만에서 45분 이상으로 거의 두 배 증가했네요.
- 자동 승인 패턴 — 신규 사용자는 약 20%의 세션에서 전체 자동 승인(auto-approve)을 사용하지만, 경험치가 쌓이면 40% 이상으로 늘어납니다.
- 에이전트 주도 중단 — 복잡한 작업에서 Claude Code 가 사람의 개입보다 2배 이상 자주 스스로 멈춰 설명을 요청합니다.
사용 도메인
- 소프트웨어 엔지니어링 — 전체 에이전트 활동의 약 50%를 차지하며 가장 큰 비중입니다.
- 고위험 도메인 — 의료·금융 등 위험도가 높은 분야에서도 소규모 사용이 확인됐지만, 아직 대규모로 확산되지는 않았습니다.
제한·주의
- 자율성 증가가 순수한 모델 성능 향상 때문만은 아니며, 사용자 적응과 신뢰 형성도 중요한 요인으로 분석됐습니다.
- 연구는 프라이버시 보호 도구를 통해 익명화된 데이터를 기반으로 하며, 개별 사용자 식별은 불가능합니다.
편집자 한 줄
에이전트가 스스로 멈추는 비율이 사람의 개입보다 높다는 점은, '자율성=통제 불가'라는 인식과 거리가 있어 흥미롭습니다.
- #anthropic
- #ai-agents
- #autonomy
- #claude-code
- #safety
Anthropic