← Back to feed
Ships·3개월 전

Google DeepMind, Gemini 3.1 Flash-Lite 공개 — $0.25/1M 입력, 2.5 Flash 대비 2.5배 빠른 TTFT

Google DeepMind, Gemini 3.1 Flash-Lite 공개 — $0.25/1M 입력, 2.5 Flash 대비 2.5배 빠른 TTFT

Google DeepMind가 Gemini 3.1 Flash-Lite를 프리뷰로 출시했다. 입력 $0.25/1M 토큰, 출력 $1.50/1M 토큰으로 2.5 Flash 대비 Time to First Answer Token 2.5배 빠르고 출력 속도 45% 향상, 벤치마크 성능도 개선됐다. 번역, 콘텐츠 모더레이션, UI 생성 등 고볼륨 작업에 적합하며, 현재 Gemini API와 Vertex AI에서 사용 가능하다.

  • #google-deepmind
  • #gemini-3.1-flash-lite
  • #pricing
  • #latency
  • #vertex-ai
Google DeepMind
원문 보기 →

Comments

— 첫 댓글을 남겨보세요 —