Ships·1개월 전
Google DeepMind, Gemini 3.1 Flash-Lite 공개 — $0.25/1M 입력, 2.5 Flash 대비 2.5배 빠른 TTFT
Google DeepMind가 Gemini 3.1 Flash-Lite를 프리뷰로 출시했다. 입력 $0.25/1M 토큰, 출력 $1.50/1M 토큰으로 2.5 Flash 대비 Time to First Answer Token 2.5배 빠르고 출력 속도 45% 향상, 벤치마크 성능도 개선됐다. 번역, 콘텐츠 모더레이션, UI 생성 등 고볼륨 작업에 적합하며, 현재 Gemini API와 Vertex AI에서 사용 가능하다.
- #google-deepmind
- #gemini-3.1-flash-lite
- #pricing
- #latency
- #vertex-ai
Google DeepMind