Papers·1개월 전

Tsinghua, 환경 엔지니어링 기반 자율 과학 발견 에이전트 EurekAgent — 26-원 패킹 SOTA, API 비용 $11 미만

Tsinghua Knowledge Engineer Group이 LLM 기반 자율 과학 발견 에이전트 EurekAgent를 공개했습니다. 환경 엔지니어링(권한, 아티팩트, 예산, 인간 개입)을 통해 에이전트의 생산적 행동을 증폭하고, 26-원 패킹 문제에서 SOTA를 달성했으며 총 API 비용은 $11 미만입니다. 수학, 커널 엔지니어링, 머신러닝 태스크 전반에서 새로운 SOTA를 기록했지만, 환경 설계의 일반화와 보상 해킹 방지가 추가 검증 과제로 남습니다.

Tsinghua 팀이 LLM 기반 자율 과학 발견 에이전트의 병목이 워크플로우가 아닌 환경 설계에 있다고 주장하며, 환경 엔지니어링 프레임워크 EurekAgent를 제안했습니다.

핵심 결론

성과 — 26-원 패킹 문제에서 SOTA 달성, API 비용 $11 미만. 수학·커널·ML 태스크 전반에서 기존 방법 대비 우수.
의의 — 환경 엔지니어링이 자율 발견 에이전트의 핵심 설계 원리임을 실증.

방법

권한 엔지니어링 — 에이전트 실행 범위를 제한하고 평가를 격리해 보상 해킹을 억제합니다.
아티팩트 엔지니어링 — 파일시스템과 Git 기반 협업 구조로 체계적인 결과물 관리를 지원합니다.
예산 엔지니어링 — 예산 인식 탐색을 통해 비용 효율적인 실험 계획을 유도합니다.
인간 개입 엔지니어링 — 간편한 감독 및 개입 인터페이스로 고마찰 감독을 줄입니다.

한계·조건

일반화 — 환경 설계가 특정 태스크에 과적합될 가능성이 있으며, 다양한 도메인으로의 확장 검증이 필요합니다.
보상 해킹 — 권한 엔지니어링이 완전히 보상 해킹을 차단하지는 못할 수 있습니다.
코드 — 코드와 결과는 오픈소스로 공개되었습니다.

편집자 한 줄

환경 엔지니어링이라는 프레임이 단순한 프롬프트 엔지니어링을 넘어 에이전트 신뢰성에 접근하는 방식이라 흥미롭습니다. 비용 대비 성능이 인상적이지만, 환경 설계의 일반화 원리가 더 정립되어야 할 듯합니다.

#environment-engineering
#autonomous-discovery
#llm-agent
#tsinghua

Knowledge Engineer Group @ Tsinghua University

원문 보기 →

Tsinghua, 환경 엔지니어링 기반 자율 과학 발견 에이전트 EurekAgent — 26-원 패킹 SOTA, API 비용 $11 미만

핵심 결론

방법

한계·조건

Comments