hypes.news
← Back to feed
Ships·6개월 전

Google DeepMind, Gemini Robotics 1.5 및 ER 1.5 공개 — VLA/VLM 모델로 물리적 에이전트 구현

Google DeepMind 가 Gemini Robotics 1.5 (VLA) 와 Gemini Robotics-ER 1.5 (VLM) 를 발표했다. Robotics 1.5 는 시각-언어-행동 모델로, 행동 전 사고 과정을 거쳐 복잡한 다단계 작업을 투명하게 수행하며, 여러 로봇 플랫폼 간 학습이 가능하다. ER 1.5 는 공간 추론 벤치마크에서 최고 성능을 기록, 디지털 도구 호출과 상세 계획 수립을 지원한다. ER 1.5 는 Google AI Studio 의 Gemini API 로 즉시 제공되며, Robotics 1.5 는 선별된 파트너에게만 공개된다.

Google DeepMind

Comments

— 첫 댓글을 남겨보세요 —