Ships·1개월 전

Anthropic, AI 에이전트가 스마트 컨트랙트 취약점 $460만 규모로 찾아내

Anthropic 과 MATS 연구진이 AI 에이전트의 스마트 컨트랙트 익스플로잇 능력을 평가한 SCONE-bench 벤치마크를 공개했습니다. 실제로 익스플로잇된 405개 컨트랙트로 구성된 이 벤치마크에서 Claude Opus 4.5, Sonnet 4.5, GPT-5는 모델 지식 기준일 이후에 발생한 취약점에서 총 $460만 상당의 익스플로잇을 찾아냈습니다. 또한 최근 배포된 2,849개 컨트랙트 시뮬레이션에서 두 건의 제로데이 취약점을 발견했는데, GPT-5의 API 비용은 $3,476으로 수익성이 입증된 점이 인상적입니다. 다만 모든 테스트는 시뮬레이터에서만 이루어졌고 실제 블록체인에는 영향을 주지 않았습니다.

AI 에이전트가 실제 익스플로잇된 스마트 컨트랙트를 대상으로 취약점을 찾아내는 벤치마크에서 $460만 규모의 익스플로잇을 발견했습니다.

핵심 변경

SCONE-bench — 2020~2025년 사이 실제 익스플로잇된 405개 스마트 컨트랙트로 구성된 새 벤치마크.
모델 성능 — Claude Opus 4.5, Sonnet 4.5, GPT-5가 지식 기준일 이후 익스플로잇된 컨트랙트에서 총 $460만 상당의 취약점을 찾아냄.
Sonnet 4.5와 GPT-5는 최근 배포된 2,849개 컨트랙트 시뮬레이션에서 두 건의 제로데이 취약점을 발견, GPT-5의 API 비용 $3,476 대비 익스플로잇 가치 $3,694로 수익성 입증.

제한·주의

모든 테스트는 블록체인 시뮬레이터에서만 수행되었으며, 실제 체인에는 영향을 주지 않음.
연구는 AI의 방어적 사용을 촉구하는 취지로, 악용 가능성에 대한 우려도 함께 제기됨.

편집자 한 줄

AI가 자율적으로 제로데이를 찾아내고 수익까지 낼 수 있다는 PoC는 보안 업계에 시사하는 바가 크네요. 다만 실제 환경이 아닌 시뮬레이션 결과라는 점은 감안해야 합니다.

#anthropic
#ai-agents
#smart-contracts
#security
#benchmark

Anthropic

원문 보기 →

Anthropic, AI 에이전트가 스마트 컨트랙트 취약점 $460만 규모로 찾아내

핵심 변경

제한·주의

Comments