새 모델·툴 출시
Ships
Ships·3일 전Anthropic, Claude Tag 출시 — Slack에서 @Claude로 팀 협업
Anthropic이 Slack에서 Claude를 팀원처럼 태그해 쓸 수 있는 Claude Tag를 베타 출시했습니다. 채널에 접근 권한을 주면 @Claude로 작업을 위임하고, Claude가 컨텍스트를 기억하며 멀티플레이어로 협업합니다. 내부적으로 제품팀 코드의 65%가 이 방식으로 생성되고 있으며, 현재 Claude Enterprise·Team 고객 대상 베타입니다.
- #anthropic
- #claude-tag
- #slack
- #collaboration
Anthropic
Ships·1주 전Anthropic Project Fetch 2단계 — Claude Opus 4.7, 인간 팀보다 20배 빠른 로봇 작업 수행
Anthropic 이 Project Fetch 2단계 결과를 발표했습니다. Claude Opus 4.7 이 인간 도움 없이 로봇 개를 조작해 1년 전 인간 팀보다 모든 작업에서 약 20배 빠르게 완료했습니다. 다만 공 옮기기(fetching) 같은 정밀 동작은 여전히 어려워했고, 저수준 제어 정책 개발은 실험 범위 밖입니다. AI가 인간을 돕는 단계를 넘어 스스로 수행하는 패턴이 사이버 보안에 이어 로보틱스에서도 나타나기 시작했다는 게 핵심입니다.
- #anthropic
- #claude-opus-4.7
- #robotics
- #project-fetch
Anthropic
Ships·1주 전Anthropic, Frontier Red Team 공식 페이지 공개 — AI 사이버 보안 위협 평가 전담 조직
Anthropic 이 AI 시스템의 사이버 보안·국가 안전·자율 시스템 위협을 평가하는 Frontier Red Team 의 공식 페이지를 공개했습니다. 이 팀은 LLM 의 취약점 악용 능력, 0-day 발견, N-day 익스플로잇 등을 측정하며, 2026년 1월부터 6월까지 10건의 연구를 발표했네요. 내부 직원을 대상으로 한 'Deal' 프로젝트에서는 Claude 가 실제 거래·협상을 수행하게 한 점이 특이합니다.
- #anthropic
- #frontier-red-team
- #cybersecurity
- #red-teaming
Anthropic
Ships·1주 전Anthropic, Claude Mythos Preview 공개 — 사이버보안에서 두드러진 성능, Project Glasswing 발표
Anthropic이 새로운 범용 언어 모델 Claude Mythos Preview를 공개했습니다. 특히 컴퓨터 보안 작업에서 뛰어난 성능을 보여, 회사는 이 모델을 활용해 세계 주요 소프트웨어를 보호하는 Project Glasswing을 시작했습니다. 지난 한 달간의 테스트 결과, Mythos Preview는 실제 오픈소스 코드베이스에서 제로데이 취약점을 찾고 익스플로잇하는 능력을 입증했으며, 클로즈드 소프트웨어 리버스 엔지니어링과 N-day 취약점 익스플로잇에도 성공했습니다. 다만 발견된 취약점의 99% 이상이 아직 패치되지 않아 상세 정보 공개에 제한이 있습니다.
- #anthropic
- #claude-mythos-preview
- #cybersecurity
- #project-glasswing
Anthropic
Ships·1주 전Anthropic, NNSA와 협력해 핵 관련 대화 분류기 공개 — 정확도 96%
Anthropic이 미국 에너지부 산하 NNSA 및 국립연구소와 협력해 AI 모델의 핵 확산 위험을 탐지하는 분류기를 공동 개발했습니다. 이 분류기는 핵 관련 대화를 우려되는 수준과 무해한 수준으로 96% 정확도로 구분하며, 이미 Claude 트래픽에 배포되어 실제 대화에서 작동 중입니다. Frontier Model Forum을 통해 다른 AI 개발사도 이 접근법을 활용할 수 있도록 공유할 예정인데, 정부-기업 협력 모델로서 참고할 만한 사례입니다.
- #anthropic
- #nuclear-safety
- #classifier
- #public-private-partnership
Anthropic
Ships·1주 전Anthropic, LLM의 N-day 익스플로잇 자동화 능력 평가 — Firefox 패치 18건 분석
Anthropic Frontier Red Team이 LLM이 N-day 취약점 익스플로잇 개발을 얼마나 가속화하는지 측정한 연구를 발표했습니다. Firefox의 최근 보안 패치 18건을 대상으로 실험한 결과, 최첨단 모델이 패치 diffing부터 익스플로잇 코드 작성까지 상당 부분 자동화할 수 있음을 보여줍니다. 이는 전통적으로 수주가 걸리던 작업이 단축될 수 있음을 시사하지만, 연구는 공격 시나리오 전체가 아닌 익스플로잇 개발 단계에 한정됩니다.
- #anthropic
- #llm-security
- #n-day
- #exploit
Anthropic
Ships·1주 전Anthropic, LLM ATT&CK Navigator 발표 — AI 활용 사이버 위협 832건 분석
Anthropic이 지난 1년간 Claude 사용정책을 위반한 832개 악성 계정을 분석해 MITRE ATT&CK 프레임워크에 매핑한 보고서를 공개했습니다. AI가 14개 전술과 482개 하위 기법에 활용됐으며, 상반기 대비 하반기 중·고위험 공격자 비율이 33%에서 56%로 증가했습니다. Verizon 2026 DBIR에도 일부 결과가 포함됐네요.
- #anthropic
- #cybersecurity
- #mitre-attack
- #ai-threats
Anthropic
Ships·1주 전Anthropic, Claude Mythos Preview의 취약점 익스플로잇 능력 측정 — 세 가지 벤치마크에서 최고 성능
Anthropic이 Claude Mythos Preview의 취약점 익스플로잇 능력을 측정한 세 가지 벤치마크 결과를 공개했습니다. ExploitBench, ExploitGym, 업데이트된 SCONE-bench에서 Mythos Preview가 모든 평가 모델을 능가했으며, 특히 단일 취약점을 익스플로잇 프리미티브로 전환하고 이를 결합해 완전한 공격 체인을 구성하는 능력이 이전 모델 대비 큰 도약을 보였습니다. 이 능력이 널리 보급되면 익스플로잇 개발에 필요한 지식 장벽이 크게 낮아질 수 있다는 점을 우려해, Mythos Preview는 일반 공개 대신 Project Glasswing을 통해 조심스럽게 출시되었습니다.
- #anthropic
- #claude-mythos-preview
- #exploit-benchmark
- #security
Anthropic
Ships·1주 전Anthropic, Claude가 Firefox 취약점 CVE-2026-2796 익스플로잇을 작성한 과정 공개
Anthropic이 Claude Opus 4.6이 Firefox에서 발견한 22개 취약점 중 하나인 CVE-2026-2796에 대한 익스플로잇을 작성한 과정을 역공학 분석한 블로그를 공개했습니다. Claude는 테스트 환경(일부 보안 기능 제거)에서만 동작하는 익스플로잇을 작성했으며, 수백 번의 시도 중 두 건만 성공했습니다. 아직 전체 체인 익스플로잇(브라우저 샌드박스 이스케이프)은 불가능하지만, LLM의 사이버 공격 능력이 빠르게 향상되고 있음을 보여주는 조기 경보 신호로 해석됩니다.
- #anthropic
- #claude
- #cybersecurity
- #exploit
Anthropic
Ships·1주 전Anthropic, Claude Opus 4.6 공개 — LLM 기반 제로데이 취약점 발견 가능
Anthropic 이 Claude Opus 4.6 을 출시하며 LLM 기반 취약점 발견 기능을 강조했습니다. Opus 4.6 은 별도 도구나 특수 프롬프트 없이도 고위험도 취약점을 찾아내며, 수년간 퍼징 테스트를 거친 코드베이스에서도 수십 년간 발견되지 않은 제로데이를 찾아냈다고 합니다. 가격은 기존 Opus 4.5 와 동일하며, API 로 즉시 사용 가능합니다.
- #anthropic
- #claude-opus-4.6
- #cybersecurity
- #zero-day
Anthropic
Ships·1주 전Anthropic, Claude 기반 속성 기반 테스트 에이전트로 NumPy·SciPy·Pandas 버그 발견
Anthropic이 Claude를 활용해 대규모 Python 프로젝트에서 버그를 효율적으로 찾아내는 에이전트를 개발했습니다. 코드의 일반 속성을 추론한 뒤 속성 기반 테스트(퍼지 테스트와 유사)를 적용해 NumPy, SciPy, Pandas 등 주요 패키지에서 실제 버그를 발견했으며, 여러 건이 이미 패치되었습니다. 기존 예제 기반 테스트가 놓치기 쉬운 엣지 케이스를 자동으로 탐색한다는 점에서 실무에 유용해 보입니다.
- #anthropic
- #claude
- #property-based-testing
- #bug-detection
Anthropic
Ships·1주 전Anthropic, Claude Sonnet 4.5 — 표준 오픈소스 도구로 다중 호스트 네트워크 공격 성공
Anthropic 이 Claude Sonnet 4.5 의 사이버 공격 능력 평가 결과를 공개했습니다. 이전 세대는 커스텀 툴킷이 필요했지만, Sonnet 4.5 는 표준 오픈소스 도구만으로 수십 개 호스트 네트워크에서 다단계 공격을 성공시켰습니다. 특히 Equifax 데이터 유출 사건을 재현한 고충실도 시뮬레이션에서 Bash 쉘과 Kali Linux 만으로 모든 개인정보를 유출하는 데 성공했는데, 이는 공개된 CVE 를 즉시 인식하고 익스플로잇 코드를 생성한 덕분입니다. 다만 이 평가는 프론티어 레드팀의 연구로, 현재 모델이 모든 네트워크에서 성공한 건 아니며 보안 기초의 중요성도 함께 강조되었습니다.
- #anthropic
- #claude-sonnet-4.5
- #cyber-security
- #red-team
Anthropic
Ships·1주 전Anthropic·PNNL, Claude로 워터플랜트 사이버 공격 모의 — 방어용 AI 레드팀 실증
Anthropic이 PNNL과 협력해 Claude를 활용한 사이버 방어 연구 결과를 공개했습니다. PNNL 연구진이 Claude 기반 에이전트로 워터플랜트 시뮬레이션을 공격하는 데 인간 전문가보다 훨씬 짧은 시간이 걸렸다고 하네요. AI가 레드팀 훈련을 가속화해 취약점을 더 빨리 식별·패치할 수 있다는 개념 증명입니다. 다만 실험실 환경 시뮬레이션 단계라 실제 인프라에 적용하려면 추가 검증이 필요해 보입니다.
- #anthropic
- #claude
- #pnnl
- #critical-infrastructure
Anthropic
Ships·1주 전Anthropic, AI 에이전트가 스마트 컨트랙트 취약점 $460만 규모로 찾아내
Anthropic 과 MATS 연구진이 AI 에이전트의 스마트 컨트랙트 익스플로잇 능력을 평가한 SCONE-bench 벤치마크를 공개했습니다. 실제로 익스플로잇된 405개 컨트랙트로 구성된 이 벤치마크에서 Claude Opus 4.5, Sonnet 4.5, GPT-5는 모델 지식 기준일 이후에 발생한 취약점에서 총 $460만 상당의 익스플로잇을 찾아냈습니다. 또한 최근 배포된 2,849개 컨트랙트 시뮬레이션에서 두 건의 제로데이 취약점을 발견했는데, GPT-5의 API 비용은 $3,476으로 수익성이 입증된 점이 인상적입니다. 다만 모든 테스트는 시뮬레이터에서만 이루어졌고 실제 블록체인에는 영향을 주지 않았습니다.
- #anthropic
- #ai-agents
- #smart-contracts
- #security
Anthropic
Ships·1주 전Anthropic, NNSA와 협력해 핵 관련 대화 분류기 개발 — 정확도 96%
Anthropic이 미국 NNSA 및 DOE 국립연구소와 협력해 핵 관련 대화를 자동 분류하는 AI 분류기를 개발했습니다. 예비 테스트에서 96% 정확도로 우려되는 대화와 정상 대화를 구별하며, 이미 Claude 트래픽에 배포되었습니다. 이 접근법은 Frontier Model Forum을 통해 다른 AI 개발사에도 공유될 예정입니다.
- #anthropic
- #nuclear-safeguards
- #public-private-partnership
- #safety
Anthropic
Ships·1주 전Anthropic·CMU, LLM 사이버 공격 툴킷 Incalmo 공개 — 10개 중 9개 네트워크 침투 성공
Anthropic 과 Carnegie Mellon University 가 LLM 이 다단계 사이버 공격을 수행할 수 있게 해주는 툴킷 Incalmo 를 연구용으로 공개했습니다. Incalmo 는 LLM 의 공격 계획을 실제 시스템 명령어로 변환해주며, 이를 적용한 결과 테스트한 10개 네트워크 중 5개를 완전히 장악하고 4개를 부분적으로 침투했습니다. 툴킷 없이 거의 실패했던 것과 대조적이네요. 다만 알려진 취약점만 활용했고, 일부 도구는 연구 시나리오에 맞춰 제작된 한계가 있습니다.
- #anthropic
- #carnegie-mellon
- #cybersecurity
- #llm
Anthropic
Ships·1주 전Anthropic, Claude 사이버 보안 대회에 출전 — 상위 25% 성적
Anthropic 이 2025년 내내 Claude 를 인간 대상 사이버 보안 경진대회에 조용히 출전시켰습니다. Claude 는 여러 대회에서 상위 25% 안에 들었지만, 최고 인간 팀에는 미치지 못했습니다. 이 실험은 AI 가 기본 취약점 자동화를 통해 공격-방어 균형을 바꿀 가능성을 시사하며, 방어 기술 연구의 필요성을 강조합니다.
- #anthropic
- #claude
- #cybersecurity
- #competition
Anthropic
Ships·1주 전Anthropic, Claude 4 사이버 공격 능력 평가 — Opus, 이전 모델 대비 큰 폭 개선
Anthropic이 Pattern Labs와 협력해 Claude Opus 4와 Sonnet 4의 사이버 보안 역량을 평가한 결과, Opus가 취약점 식별과 다단계 공격 체인 실행에서 이전 모델 대비 현저한 개선을 보였습니다. 특히 실패한 접근을 반복하지 않고 유연하게 전략을 전환하는 능력이 눈에 띄네요. 다만 예상치 못한 장애물에 직면했을 때 장기 계획을 일관되게 유지하는 데는 여전히 한계가 있습니다.
- #anthropic
- #claude-opus-4
- #claude-sonnet-4
- #cybersecurity
Anthropic
Ships·1주 전Anthropic, LLM 생물학적 위험 평가와 안전장치 강화 — ASL-3 보호 조치 활성화
Anthropic 이 Claude Opus 4 출시와 함께 AI Safety Level 3 (ASL-3) 보호 조치를 활성화했습니다. 이는 모델이 생물학 무기 개발에 도움을 줄 가능성을 배제할 수 없다는 평가에 따른 예방적 결정입니다. 프론티어 레드팀은 LLM의 이중 용도 가능성에 주목하며, 생물학적 위험 평가를 책임 있는 AI 개발의 핵심 요소로 보고 있습니다.
- #anthropic
- #claude-opus-4
- #asl-3
- #biorisk
Anthropic
Ships·1주 전Anthropic, Claude Sonnet 4.5 사이버 방어 능력 대폭 향상 — Opus 4.1 수준 도달
Anthropic이 Claude의 사이버 방어 능력을 개선한 연구 결과를 공개했습니다. Claude Sonnet 4.5는 코드 취약점 발견 등에서 Opus 4.1과 동등하거나 능가하는 성능을 보였으며, DARPA AI Cyber Challenge에서도 LLM 기반 사이버 추론 시스템 구축에 기여했습니다. 다만 이 연구는 주로 방어 측면에 초점을 맞추고 있으며, 공격 도구로서의 악용 가능성에 대한 논의는 생략되어 있습니다.
- #anthropic
- #claude
- #cybersecurity
- #defense
Anthropic
Ships·1주 전Anthropic, 서울 사무소 개소 및 한국 AI 생태계 파트너십 확대
Anthropic 이 서울 사무소를 열고 한국 AI 생태계와의 협력을 강화합니다. NAVER 는 전 엔지니어 조직에 Claude Code 를 도입했고, Nexon 은 게임 개발에, LG CNS 와 한화솔루션은 기업 업무에 Claude 를 배포 중입니다. 한국 대표 지사장은 최기영 씨가 맡았네요.
- #anthropic
- #claude
- #korea
- #partnerships
Anthropic
Ships·1주 전Anthropic, Claude Code 사용 분석 — 도메인 전문성이 성공률 결정
Anthropic 이 Claude Code 세션 약 40만 건을 분석한 연구를 발표했습니다. 사람은 계획(무엇을 할지)을, AI는 실행(어떻게 할지)을 주로 담당하며, 도메인 전문성이 높을수록 지시당 AI 작업량이 증가합니다. 디버깅 비중은 7개월간 절반 가까이 줄었고, 태스크 가치는 평균 25% 상승했습니다. 비개발자도 소프트웨어 엔지니어와 비슷한 성공률을 보인 점이 흥미롭네요.
- #anthropic
- #claude-code
- #agentic-coding
- #productivity
Anthropic
Ships·1주 전Anthropic, AI 안전에 대한 핵심 입장 공개 — 10년 내 변혁적 AI 가능성 경고
Anthropic 이 AI 안전에 대한 핵심 입장을 공개했습니다. 회사는 10년 내 변혁적 AI 시스템이 등장할 가능성이 있지만, 이를 안전하고 인간 가치에 부합하게 만드는 방법은 아직 모른다고 주장합니다. 이에 따라 연구 방향을 이해, 평가, 정렬에 집중하고 있으며, 공공 및 민간 부문의 광범위한 지원이 시급하다고 강조합니다. 실무자 입장에선 구체적인 제품 발표가 아닌 원칙 선언 수준이라, 향후 연구 결과물이 더 중요해 보입니다.
- #anthropic
- #ai-safety
- #scaling-laws
- #alignment
Anthropic
Ships·2주 전미국 정부, Anthropic Fable 5·Mythos 5 수출 통제 — 외국인 접근 전면 차단
미국 정부가 국가안보를 이유로 Anthropic의 최신 모델 Fable 5와 Mythos 5에 대한 외국인 접근을 전면 금지하는 수출 통제 지시를 내렸습니다. Anthropic은 모든 고객에 대해 두 모델의 접근을 즉시 차단했으며, 다른 모델에는 영향이 없습니다. 정부는 특정 탈옥 방법이 발견되었다고 밝혔으나, Anthropic은 해당 취약점이 경미하고 다른 공개 모델에서도 발견 가능한 수준이라고 반박했습니다.
- #anthropic
- #fable-5
- #mythos-5
- #export-control
Anthropic
Ships·2주 전TCS, Anthropic과 파트너십 — Claude 직원 5만 명 도입, 규제 산업 공략
Tata Consultancy Services(TCS)가 Anthropic과 파트너십을 맺고 자사 직원 5만 명에게 Claude를 제공합니다. TCS는 금융·헬스케어·공공 등 규제 산업 대상 Claude 기반 제품을 구축하고 Claude Partner Network에 합류합니다. 이미 Diligenta의 보험 청구 처리, 은행권 Claude Code 도입 등 구체 작업이 진행 중입니다.
- #anthropic
- #tcs
- #claude
- #enterprise
Anthropic
Ships·2주 전Anthropic Public Record 1차 조사 — 미국인 48%, AI로 질병 치료 최우선 기대
Anthropic 이 미국인 약 5만 2000명을 대상으로 실시한 AI 인식 조사 결과를 공개했습니다. 응답자의 48%가 암·알츠하이머 같은 질병 치료를 AI의 최대 기대 분야로 꼽았고, 64%는 AI로 인한 일자리 손실을 가장 두려워했습니다. 정부 규제에 대한 지지는 초당적으로 70%를 넘었고, AI 기업에 대한 신뢰는 15%에 불과했습니다. 흥미로운 점은 정당·지역·교육 수준에 따른 큰 이견이 없었다는 점입니다.
- #anthropic
- #public-opinion
- #ai-governance
- #survey
Anthropic
Ships·2주 전Anthropic, DXC Technology와 글로벌 제휴 — Claude, 은행·항공·규제 산업에 도입
Anthropic이 IT 서비스 대기업 DXC Technology와 다년간 글로벌 제휴를 맺었습니다. DXC는 수만 명의 Claude 인증 엔지니어(FDE)를 양성해 자사가 운영하는 은행·항공·보험·정부 시스템에 Claude를 통합할 예정입니다. DXC는 자사 운영에도 Claude를 적용해 OASIS 플랫폼 코드의 95% 이상을 Claude로 생성했으며, 개발 속도가 10배 빨라졌다고 추정합니다. DXC는 Claude Partner Network에도 합류했습니다.
- #anthropic
- #claude
- #dxc-technology
- #enterprise
Anthropic
Ships·2주 전Anthropic, Claude Corps 펠로우십 프로그램 발표 — 1,000명 선발, $150M 투입
Anthropic이 Claude Corps라는 국가 펠로우십 프로그램을 발표했습니다. 초기 경력자 1,000명을 선발해 Claude 사용법을 교육하고, 미국 전역 비영리 단체에 매칭해 1년간 풀타임 근무를 지원합니다. Anthropic은 이 프로그램에 초기 $150M을 투입하며, CodePath와 Social Finance가 파트너로 참여합니다. AI로 인한 노동시장 변화에 대응해 직접적인 인력 투자를 선택한 점이 눈에 띕니다.
- #anthropic
- #claude
- #fellowship
- #nonprofit
Anthropic
Ships·2주 전Anthropic, Claude Fable 5·Mythos 5 공개 — Mythos급 모델을 일반에 안전장치 적용
Anthropic 이 Mythos급 모델 Claude Fable 5를 일반 공개했습니다. 기존 Opus 4.8을 넘는 성능을 보이지만, 안전장치가 민감 주제를 Opus 4.8로 우회시키는 방식이라 5% 미만 세션에서 오탐이 발생합니다. 사이버 방어용 Mythos 5는 제한된 접근으로 Project Glasswing에 우선 배포되며, 향후 신뢰 접근 프로그램으로 확대 예정입니다.
- #anthropic
- #claude-fable-5
- #claude-mythos-5
- #safety
Anthropic
- Ships·2주 전
Anthropic, 생물학 연구용 AI 에이전트 공개 — 실험 설계·데이터 분석 자동화
Anthropic 이 생물학 연구를 위한 AI 에이전트 시스템을 공개했습니다. 실험 프로토콜 작성, 데이터 분석, 문헌 검토 등을 자동화하며, 연구자가 프롬프트로 작업을 지시하면 에이전트가 단계별로 실행합니다. 현재는 연구용 프리뷰 단계로, API를 통해 사용 가능하며, 비용은 작업 복잡도에 따라 달라집니다. 실험 설계 자동화는 유용하지만, 결과 해석의 신뢰성 검증이 필요해 보입니다.
- #anthropic
- #biology
- #agents
- #research
Anthropic