← Back to feed
Papers·2일 전

AutoResearchClaw: 다중 에이전트 연구 파이프라인, ARC-Bench에서 AI Scientist v2 대비 54.7% 향상

AutoResearchClaw: 다중 에이전트 연구 파이프라인, ARC-Bench에서 AI Scientist v2 대비 54.7% 향상

AutoResearchClaw는 다중 에이전트 기반의 자율 연구 파이프라인으로, 구조화된 다중 에이전트 토론, 자가 치유 실행기(Pivot/Refine 루프), 검증 가능한 결과 보고, 인간 개입 7단계 모드, 실행 간 경험 전이를 특징으로 합니다. ARC-Bench(25개 주제 실험 단계 벤치마크)에서 AI Scientist v2 대비 54.7% 더 나은 성능을 기록했습니다. 단, 인간 개입 모드 실험에서는 완전 자동화나 단계별 감독보다 고레버리지 의사결정 지점에 정밀한 개입이 효과적임을 보여줍니다. 코드는 공개되었습니다.

  • #multi-agent
  • #scientific-discovery
  • #automl
  • #arc-bench
  • #self-healing
Jiaqi Liu

Comments

— 첫 댓글을 남겨보세요 —