hypes.news
← Back to feed
Papers·6일 전

Amazon AGI: ToolsRL — 강화학습으로 시각적 추론에서 도구 사용 마스터

Amazon AGI: ToolsRL — 강화학습으로 시각적 추론에서 도구 사용 마스터

Amazon AGI 팀이 다중모달 LLM의 복잡한 시각적 추론을 위해 도구-지도 강화학습(ToolsRL) 프레임워크를 제안했다. 줌인, 회전, 플립, 점/선 그리기 등 해석 가능한 기본 시각 도구를 사용하며, 1단계에서 도구별 보상으로 도구 호출 능력을 먼저 학습하고 2단계에서 정확도 보상으로 추론 과제를 수행하는 커리큘럼을 설계했다. 이종 최적화 충돌을 피해 도구 사용 능력을 효과적으로 습득했으며, 복잡한 시각 추론 벤치마크에서 강력한 성능을 보였다.

Amazon AGI

Comments

— 첫 댓글을 남겨보세요 —