← Back to feed
Papers·어제

Microsoft Orchard: 오픈소스 에이전트 학습 프레임워크 — SWE-bench 67.5%, GUI 에이전트 74.1%

Microsoft Orchard: 오픈소스 에이전트 학습 프레임워크 — SWE-bench 67.5%, GUI 에이전트 74.1%

Microsoft Research가 공개한 Orchard는 경량 환경 서비스(Orchard Env)를 기반으로 코드, GUI, 개인 비서 에이전트를 확장 가능하게 학습시키는 오픈소스 프레임워크입니다. SWE-bench Verified에서 Qwen3-30B-A3B-Thinking 기반 Orchard-SWE가 SFT+RL로 67.5%를 달성했고, GUI 에이전트는 4B 모델로 WebVoyager 74.1%를 기록해 오픈소스 중 최고 성능입니다. 다만 각 레시피가 특정 벤치마크에 맞춰져 있고, RL 단계의 계산 비용이 상당하다는 점은 유의할 필요가 있습니다.

  • #microsoft
  • #agent
  • #open-source
  • #swe-bench
  • #gui-agent
Microsoft Research

Comments

— 첫 댓글을 남겨보세요 —