Ships·2개월 전
Anthropic, 장기 실행 AI 에이전트로 과학 컴퓨팅 자동화 — Claude Code로 수일 작업을 수시간으로

Anthropic Discovery 팀이 과학 컴퓨팅에 장기 실행 에이전트 워크플로를 적용하는 방법을 공개했습니다. Claude Opus 4.6을 사용해 우주론 볼츠만 솔버를 미분 가능 버전으로 재구현하는 예시를 제시하며, 테스트 오라클·영구 메모리·오케스트레이션 패턴을 활용해 수일~수개월 걸리던 작업을 수시간으로 단축할 수 있다고 설명합니다. 이전 C 컴파일러 프로젝트(약 2,000 세션)의 경험을 과학 코드에 맞게 일반화한 셈인데, 특정 도메인 지식이 없어도 적용 가능한 점이 실무자에게 유용해 보입니다.
Anthropic이 과학 컴퓨팅에 특화된 장기 실행 AI 에이전트 워크플로를 공개했습니다. Claude Code를 활용해 수일~수개월 작업을 수시간으로 단축하는 패턴을 제시합니다.
핵심 변경
- 워크플로 — 기존 대화형 루프에서 벗어나, 고수준 목표만 설정하고 에이전트 팀이 며칠간 자율적으로 작업하는 패턴.
- 적용 사례 — Claude Opus 4.6으로 우주론 볼츠만 솔버(CLASS/CAMB)를 미분 가능 버전으로 재구현 — 수치 솔버 재작성, 레거시 Fortran 코드 현대화, 대규모 코드 디버깅 등에 적합.
- 이전 C 컴파일러 프로젝트(약 2,000 세션)의 경험을 과학 컴퓨팅에 일반화한 접근법.
가격·가용성
- 도구 — Claude Code (현재 API 기반 CLI 도구)를 통해 사용 가능 — 별도 SDK 없이 Claude Opus 4.6 이상 필요.
- 대상 — 일반 연구실 환경을 염두에 두고 설계, 특정 도메인 지식 없이도 적용 가능.
제한·주의
- 장기 실행 에이전트는 작업 범위가 명확하고 성공 기준이 정량화된 태스크에 적합 — 탐색적 연구나 모호한 목표에는 부적합.
- 멀티 세션 작업에는 영구 메모리와 테스트 오라클 설계가 필수적이며, 초기 설정 비용이 발생할 수 있음.
편집자 한 줄
과학 컴퓨팅에 장기 실행 에이전트를 적용한 사례는 드물어서, 특히 C 컴파일러 프로젝트의 교훈을 일반화한 점이 인상적입니다. 다만 실제 연구 현장에서 자율 에이전트의 결과를 신뢰할 수준인지는 추가 검증이 필요해 보입니다.
- #anthropic
- #claude-opus-4.6
- #scientific-computing
- #agentic-workflow
- #claude-code
Anthropic