← Back to feed
Ships·1년 전

Google DeepMind, Gemma 3n Preview 공개 — 모바일 최적화, RAM 사용량 40% 감소

Google DeepMind, Gemma 3n Preview 공개 — 모바일 최적화, RAM 사용량 40% 감소

Google DeepMind가 모바일 기기에서 실시간 AI 추론을 위해 설계된 Gemma 3n Preview를 공개했다. Qualcomm, MediaTek, 삼성과 협력해 개발한 새로운 아키텍처를 기반으로 하며, Per-Layer Embeddings(PLE) 기술로 RAM 사용량을 40% 줄였다. Gemma 3 대비 추론 속도가 2배 향상되었고, 1.5B~7B 파라미터 크기로 제공된다. 현재 조기 프리뷰 단계로, Android 및 Chrome 플랫폼에 올해 말 적용될 Gemini Nano의 기반이 된다.

  • #google-deepmind
  • #gemma-3n
  • #mobile-ai
  • #on-device
  • #open-model
Google DeepMind
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —