English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
注册

Gemini 2.0 Flash-Lite

模型概览

Gemini 2.0 Flash-Lite 是 Gemini 2.0 Flash 的轻量级版本,针对成本效率和低延迟进行了优化。

主要特点

  • 中等智能水平(2/4点评分)
  • 极快速度(5/5闪电评分)
  • 1,048,576上下文窗口
  • 8,192最大输出令牌
  • 2024年8月知识截止
  • 支持音频、图像、视频和文本输入
  • 支持文本输出

技术规格

  • 模型代码: gemini-2.0-flash-lite
  • 支持: 输入:音频、图像、视频、文本;输出:仅文本
  • 功能: 结构化输出、缓存、函数调用
  • 价格:
    • 输入:每1M令牌$0.075
    • 输出:每1M令牌$0.30
  • 免费套餐: 可用

快照

  • gemini-2.0-flash-lite(最新)
  • gemini-2.0-flash-lite-001(稳定)

定位和用例

针对成本效率和低延迟进行了优化。适用于速度和成本比最大智能更重要的高流量应用。

速率限制

  • 适用标准速率限制

文档

官方文档

Google

由强大技术专长支持的下一代AI模型

Gemini 2.0 Flash-Lite

参数量 5/5 lightning bolts rating
Output tokens 8,192 tokens

Gemini 2.0 Flash-Lite 是 Gemini 2.0 Flash 的轻量级版本,针对成本效率和低延迟进行了优化。

官方价格:$0.075 • $0.30 我们的价格:$0.06 • $0.24 节省 20%

常见问题

运行时间保证是什么?
我们通过企业级基础设施和冗余系统保证99.9%的运行时间。
如何计算价格?
定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。
GPT-4和GPT-4 Turbo之间有什么区别?
GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。