Ships·11개월 전
Google DeepMind, Gemma 3n Preview 공개 — 모바일 최적화, RAM 사용량 40% 감소
Google DeepMind가 모바일 기기에서 실시간 AI 추론을 위해 설계된 Gemma 3n Preview를 공개했다. Qualcomm, MediaTek, 삼성과 협력해 개발한 새로운 아키텍처를 기반으로 하며, Per-Layer Embeddings(PLE) 기술로 RAM 사용량을 40% 줄였다. Gemma 3 대비 추론 속도가 2배 향상되었고, 1.5B~7B 파라미터 크기로 제공된다. 현재 조기 프리뷰 단계로, Android 및 Chrome 플랫폼에 올해 말 적용될 Gemini Nano의 기반이 된다.
- #google-deepmind
- #gemma-3n
- #mobile-ai
- #on-device
- #open-model
Google DeepMind