Ships·1년 전

Google DeepMind, Gemma 3n Preview 공개 — 모바일 최적화, RAM 사용량 40% 감소

Google DeepMind가 모바일 기기에서 실시간 AI 추론을 위해 설계된 Gemma 3n Preview를 공개했다. Qualcomm, MediaTek, 삼성과 협력해 개발한 새로운 아키텍처를 기반으로 하며, Per-Layer Embeddings(PLE) 기술로 RAM 사용량을 40% 줄였다. Gemma 3 대비 추론 속도가 2배 향상되었고, 1.5B~7B 파라미터 크기로 제공된다. 현재 조기 프리뷰 단계로, Android 및 Chrome 플랫폼에 올해 말 적용될 Gemini Nano의 기반이 된다.

#google-deepmind
#gemma-3n
#mobile-ai
#on-device
#open-model

Google DeepMind

원문 보기 →

Google DeepMind, Gemma 3n Preview 공개 — 모바일 최적화, RAM 사용량 40% 감소

Comments