模型概述
Gemini 1.5 Flash-8B 是一款较小的模型,专为高容量和较低智能任务设计,具有成本效益。
主要特点
- 中等智能(2/4点评级)
- 非常快的速度(5/5闪电评级)
- 1,048,576上下文窗口
- 8,192最大输出标记
- 知识截止日期未指定
- 支持音频、图像、视频和文本输入
- 支持文本输出
技术规格
- 模型代码: gemini-1.5-flash-8b
- 支持: 输入:音频、图像、视频、文本;输出:仅文本
- 功能: 系统指令、JSON模式、JSON架构、可调安全设置、缓存、调优、函数调用、代码执行
- 音频/视觉规格: 每个提示最多3,600张图像,1小时视频,约9.5小时音频
- 定价:
- 输入:$0.0375/百万标记(≤128k提示),$0.075/百万标记(>128k提示)
- 输出:$0.15/百万标记(≤128k提示),$0.30/百万标记(>128k提示)
- 上下文缓存:$0.01/百万标记(≤128k),$0.02/百万标记(>128k),$0.25/小时存储
- 免费层级: 可用
快照版本
- gemini-1.5-flash-8b(最新稳定版)
- gemini-1.5-flash-8b-latest
- gemini-1.5-flash-8b-001(稳定版)
定位和使用场景
针对高容量和较低智能任务进行优化。对于不需要高级推理的简单任务,是最具成本效益的选择。
速率限制
文档
官方文档