Ships·1개월 전

Anthropic, AI 에이전트 자율성 실측 연구 공개 — Claude Code 자율 작업 시간 45분 이상으로 증가

Anthropic 이 Claude Code 및 API 데이터를 분석한 연구에서, AI 에이전트의 실제 자율성 수준을 측정했습니다. Claude Code 의 연속 작업 시간이 3개월 만에 25분에서 45분 이상으로 거의 두 배 증가했고, 숙련 사용자는 더 자주 자동 승인(auto-approve)을 사용하지만 개입 빈도는 오히려 늘어나는 패턴을 보였습니다. 소프트웨어 엔지니어링이 에이전트 활동의 약 50%를 차지했고, 의료·금융 등 고위험 도메인에서도 소규모 사용이 확인됐습니다.

Anthropic 이 Claude Code 와 API 데이터를 바탕으로 AI 에이전트의 실제 자율성과 사용 패턴을 실측한 연구를 발표했습니다.

핵심 발견

자율 작업 시간 — Claude Code 의 가장 긴 연속 작업 시간이 3개월 전 25분 미만에서 45분 이상으로 거의 두 배 증가했네요.
자동 승인 패턴 — 신규 사용자는 약 20%의 세션에서 전체 자동 승인(auto-approve)을 사용하지만, 경험치가 쌓이면 40% 이상으로 늘어납니다.
에이전트 주도 중단 — 복잡한 작업에서 Claude Code 가 사람의 개입보다 2배 이상 자주 스스로 멈춰 설명을 요청합니다.

사용 도메인

소프트웨어 엔지니어링 — 전체 에이전트 활동의 약 50%를 차지하며 가장 큰 비중입니다.
고위험 도메인 — 의료·금융 등 위험도가 높은 분야에서도 소규모 사용이 확인됐지만, 아직 대규모로 확산되지는 않았습니다.

제한·주의

자율성 증가가 순수한 모델 성능 향상 때문만은 아니며, 사용자 적응과 신뢰 형성도 중요한 요인으로 분석됐습니다.
연구는 프라이버시 보호 도구를 통해 익명화된 데이터를 기반으로 하며, 개별 사용자 식별은 불가능합니다.

편집자 한 줄

에이전트가 스스로 멈추는 비율이 사람의 개입보다 높다는 점은, '자율성=통제 불가'라는 인식과 거리가 있어 흥미롭습니다.

#anthropic
#ai-agents
#autonomy
#claude-code
#safety

Anthropic

원문 보기 →

Anthropic, AI 에이전트 자율성 실측 연구 공개 — Claude Code 자율 작업 시간 45분 이상으로 증가

핵심 발견

사용 도메인

제한·주의

Comments