Gemini 1.5 Flash-8B

模型概述

Gemini 1.5 Flash-8B 是一款较小的模型，专为高容量和较低智能任务设计，具有成本效益。

模型代码： gemini-1.5-flash-8b
支持： 输入：音频、图像、视频、文本；输出：仅文本
功能： 系统指令、JSON模式、JSON架构、可调安全设置、缓存、调优、函数调用、代码执行
音频/视觉规格： 每个提示最多3,600张图像，1小时视频，约9.5小时音频
定价：
- 输入：$0.0375/百万标记（≤128k提示），$0.075/百万标记（>128k提示）
- 输出：$0.15/百万标记（≤128k提示），$0.30/百万标记（>128k提示）
- 上下文缓存：$0.01/百万标记（≤128k），$0.02/百万标记（>128k），$0.25/小时存储
免费层级： 可用

针对高容量和较低智能任务进行优化。对于不需要高级推理的简单任务，是最具成本效益的选择。

由强大技术专长支持的下一代AI模型

参数量 Unknow

Output tokens 8,192 tokens

Gemini 1.5 Flash-8B 是一款较小的模型，专为高容量和较低智能任务设计，具有成本效益。

官方价格：$0.0375 • $0.15 我们的价格：$0.03 • $0.12 节省 20%

返回列表立即尝试

常见问题

运行时间保证是什么？

我们通过企业级基础设施和冗余系统保证99.9%的运行时间。

如何计算价格？

定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。

GPT-4和GPT-4 Turbo之间有什么区别？

GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。