Gemini 2.5 Flash Preview

模型概览

Gemini 2.5 Flash 是谷歌在价格性能方面最佳的模型，提供具有自适应思考能力的全面功能。

模型代码: gemini-2.5-flash-preview-05-20
支持: 输入：音频、图像、视频、文本；输出：仅文本
功能: 缓存、代码执行、函数调用、搜索接地、结构化输出、思考
价格:
- 输入: $0.15/百万令牌（文本/图像/视频），$1.00/百万令牌（音频）
- 输出: $0.60/百万令牌（非思考），$3.50/百万令牌（思考）
- 上下文缓存: $0.0375/百万令牌（文本/图像/视频），$0.25/百万令牌（音频），$1.00/百万令牌每小时存储
- TTS: $0.50输入，$10.00输出每百万令牌
免费层级: 可用

模型根据需要进行思考或可以配置思考预算。最适合需要思考的低延迟、高容量任务。针对各种任务的自适应思考和成本效益进行了优化。

由强大技术专长支持的下一代AI模型

参数量 4/5 lightning bolts rating

Output tokens 65,536 tokens

Gemini 2.5 Flash 是谷歌在价格性能方面最佳的模型，提供具有自适应思考能力的全面功能。

官方价格：$0.15 • $0.6 我们的价格：$0.12 • $0.48 节省 20%

返回列表立即尝试

常见问题

运行时间保证是什么？

我们通过企业级基础设施和冗余系统保证99.9%的运行时间。

如何计算价格？

定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。

GPT-4和GPT-4 Turbo之间有什么区别？

GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。