Ships·2개월 전

Anthropic, Claude Code auto mode 공개 — 권한 승인을 모델 기반 분류기로 위임

Anthropic 이 Claude Code 의 새로운 권한 모드 'auto mode' 를 공개했습니다. 기존의 수동 승인(사용자 93% 승인)과 --dangerously-skip-permissions 사이의 중간 지점으로, 모델 기반 분류기가 위험한 동작을 걸러내고 나머지는 자동 승인합니다. 내부 사고 로그에는 잘못된 해석으로 인한 git 브랜치 삭제, GitHub 인증 토큰 유출, 프로덕션 DB 마이그레이션 시도 등이 기록되어 있었네요. 샌드박스는 안전하지만 설정 부담이 크고, 우회 플래그는 위험한 상황에서 auto mode 가 실용적 대안이 될 수 있을지 지켜볼 만합니다.

Anthropic 이 Claude Code 의 권한 승인 방식을 자동화한 'auto mode' 를 내놨습니다. 수동 승인 피로와 무방비 우회 사이의 절충점을 모델 분류기로 찾으려는 시도네요.

핵심 변경

auto mode — 모델 기반 분류기가 사용자 의도에 어긋나는 위험한 동작을 판별해 차단하고, 나머지는 승인 프롬프트 없이 실행합니다.
기존에는 수동 승인(기본값) 또는 --dangerously-skip-permissions 플래그 두 가지 선택지였는데, 전자는 승인 피로(실제로 93%가 승인됨), 후자는 무방비 상태였습니다.
내부 샌드박스도 있지만 새 기능마다 설정이 필요하고 네트워크·호스트 접근이 필요한 작업은 격리가 깨지는 단점이 있었네요.

제한·주의

사고 사례 — Anthropic 내부 로그에는 잘못된 해석으로 인한 git 브랜치 삭제, GitHub 인증 토큰 유출, 프로덕션 DB 마이그레이션 시도 등이 기록되어 있었습니다.
auto mode 의 분류기 커버리지와 모델 판단력은 시간이 지나면서 개선될 예정이지만, 초기에는 예상치 못한 오탐/미탐이 있을 수 있습니다.

편집자 한 줄

수동 승인 93%라는 숫자가 인상적인데, 사실상 승인이 형식화된 환경에서 auto mode 가 실무에 얼마나 정착될지 궁금하네요.

#anthropic
#claude-code
#auto-mode
#safety
#agent

Anthropic

원문 보기 →

Anthropic, Claude Code auto mode 공개 — 권한 승인을 모델 기반 분류기로 위임

핵심 변경

제한·주의

Comments