← Back to feed
Ships·3시간 전

Anthropic, AI 에이전트 자율성 실측 연구 공개 — Claude Code 자율 작업 시간 45분 이상으로 증가

Anthropic, AI 에이전트 자율성 실측 연구 공개 — Claude Code 자율 작업 시간 45분 이상으로 증가

Anthropic 이 Claude Code 및 API 데이터를 분석한 연구에서, AI 에이전트의 실제 자율성 수준을 측정했습니다. Claude Code 의 연속 작업 시간이 3개월 만에 25분에서 45분 이상으로 거의 두 배 증가했고, 숙련 사용자는 더 자주 자동 승인(auto-approve)을 사용하지만 개입 빈도는 오히려 늘어나는 패턴을 보였습니다. 소프트웨어 엔지니어링이 에이전트 활동의 약 50%를 차지했고, 의료·금융 등 고위험 도메인에서도 소규모 사용이 확인됐습니다.

Anthropic 이 Claude Code 와 API 데이터를 바탕으로 AI 에이전트의 실제 자율성과 사용 패턴을 실측한 연구를 발표했습니다.

핵심 발견

  • 자율 작업 시간Claude Code 의 가장 긴 연속 작업 시간이 3개월 전 25분 미만에서 45분 이상으로 거의 두 배 증가했네요.
  • 자동 승인 패턴신규 사용자는 약 20%의 세션에서 전체 자동 승인(auto-approve)을 사용하지만, 경험치가 쌓이면 40% 이상으로 늘어납니다.
  • 에이전트 주도 중단복잡한 작업에서 Claude Code 가 사람의 개입보다 2배 이상 자주 스스로 멈춰 설명을 요청합니다.

사용 도메인

  • 소프트웨어 엔지니어링전체 에이전트 활동의 약 50%를 차지하며 가장 큰 비중입니다.
  • 고위험 도메인의료·금융 등 위험도가 높은 분야에서도 소규모 사용이 확인됐지만, 아직 대규모로 확산되지는 않았습니다.

제한·주의

  • 자율성 증가가 순수한 모델 성능 향상 때문만은 아니며, 사용자 적응과 신뢰 형성도 중요한 요인으로 분석됐습니다.
  • 연구는 프라이버시 보호 도구를 통해 익명화된 데이터를 기반으로 하며, 개별 사용자 식별은 불가능합니다.

편집자 한 줄

에이전트가 스스로 멈추는 비율이 사람의 개입보다 높다는 점은, '자율성=통제 불가'라는 인식과 거리가 있어 흥미롭습니다.

  • #anthropic
  • #ai-agents
  • #autonomy
  • #claude-code
  • #safety
Anthropic
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —