Ships·10개월 전
Google DeepMind, Gemini 2.5 Flash-Lite 프리뷰 공개 — 가장 저렴하고 빠른 추론 모델
Google DeepMind가 Gemini 2.5 모델군 업데이트를 발표했다. 신규 모델 Gemini 2.5 Flash-Lite는 프리뷰로 제공되며, 1.5/2.0 Flash 대비 성능 향상, 최저 지연시간 및 비용을 자랑한다. 추론 기능은 기본 비활성화되어 있어 고처리량 작업(분류, 요약)에 적합하며, Grounding with Google Search, Code Execution 등 네이티브 도구를 지원한다. 2.5 Pro와 Flash는 정식 출시되었고, Flash의 가격은 입력 $0.15/1M 토큰, 출력 $0.60/1M 토큰으로 인하되었다.
- #google-deepmind
- #gemini-2.5
- #flash-lite
- #pricing
- #preview
Google DeepMind