English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
注册

Gemini 2.5 Flash Preview

模型概览

Gemini 2.5 Flash 是谷歌在价格性能方面最佳的模型,提供具有自适应思考能力的全面功能。

主要特点

  • 高智能(3/4点评级)
  • 快速响应(4/5闪电评级)
  • 1,048,576上下文窗口
  • 65,536最大输出令牌数
  • 2025年1月知识截止日期
  • 支持音频、图像、视频和文本输入
  • 支持文本输出

技术规格

  • 模型代码: gemini-2.5-flash-preview-05-20
  • 支持: 输入:音频、图像、视频、文本;输出:仅文本
  • 功能: 缓存、代码执行、函数调用、搜索接地、结构化输出、思考
  • 价格:
    • 输入: $0.15/百万令牌(文本/图像/视频),$1.00/百万令牌(音频)
    • 输出: $0.60/百万令牌(非思考),$3.50/百万令牌(思考)
    • 上下文缓存: $0.0375/百万令牌(文本/图像/视频),$0.25/百万令牌(音频),$1.00/百万令牌每小时存储
    • TTS: $0.50输入,$10.00输出每百万令牌
  • 免费层级: 可用

快照

  • gemini-2.5-flash-preview-05-20

定位和使用场景

模型根据需要进行思考或可以配置思考预算。最适合需要思考的低延迟、高容量任务。针对各种任务的自适应思考和成本效益进行了优化。

速率限制

  • 由于是实验性/预览模型,速率限制更严格

文档

官方文档

Google

由强大技术专长支持的下一代AI模型

Gemini 2.5 Flash Preview

参数量 4/5 lightning bolts rating
Output tokens 65,536 tokens

Gemini 2.5 Flash 是谷歌在价格性能方面最佳的模型,提供具有自适应思考能力的全面功能。

官方价格:$0.15 • $0.6 我们的价格:$0.12 • $0.48 节省 20%

常见问题

运行时间保证是什么?
我们通过企业级基础设施和冗余系统保证99.9%的运行时间。
如何计算价格?
定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。
GPT-4和GPT-4 Turbo之间有什么区别?
GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。