Papers·1개월 전

AutoResearchClaw: 다중 에이전트 연구 파이프라인, ARC-Bench에서 AI Scientist v2 대비 54.7% 향상

AutoResearchClaw는 다중 에이전트 기반의 자율 연구 파이프라인으로, 구조화된 다중 에이전트 토론, 자가 치유 실행기(Pivot/Refine 루프), 검증 가능한 결과 보고, 인간 개입 7단계 모드, 실행 간 경험 전이를 특징으로 합니다. ARC-Bench(25개 주제 실험 단계 벤치마크)에서 AI Scientist v2 대비 54.7% 더 나은 성능을 기록했습니다. 단, 인간 개입 모드 실험에서는 완전 자동화나 단계별 감독보다 고레버리지 의사결정 지점에 정밀한 개입이 효과적임을 보여줍니다. 코드는 공개되었습니다.

#multi-agent
#scientific-discovery
#automl
#arc-bench
#self-healing

Jiaqi Liu

원문 보기 →

AutoResearchClaw: 다중 에이전트 연구 파이프라인, ARC-Bench에서 AI Scientist v2 대비 54.7% 향상

Comments