模型概览
Gemini 1.5 Pro是一个中型多模态模型,针对需要更高智能的复杂推理任务进行了优化,具有卓越的长上下文能力。
主要特点
- 极高的智能水平(4/4点评分)
- 中等速度(3/5闪电评分)
- 2,097,152上下文窗口
- 8,192最大输出令牌数
- 知识截止日期未指定
- 支持音频、图像、视频和文本输入
- 支持文本输出
技术规格
- 模型代码: gemini-1.5-pro
- 支持: 输入:音频、图像、视频、文本;输出:仅文本
- 功能: 系统指令、JSON模式、JSON架构、可调安全设置、缓存、函数调用、代码执行
- 音视频规格: 每个提示最多7,200张图片,2小时视频,约19小时音频
- 价格:
- 输入:$1.25/百万令牌(≤128k提示),$2.50/百万令牌(>128k提示)
- 输出:$5.00/百万令牌(≤128k提示),$10.00/百万令牌(>128k提示)
- 上下文缓存:$0.3125/百万令牌(≤128k),$0.625/百万令牌(>128k),$4.50/小时存储
- 免费层级: 可用
快照版本
- gemini-1.5-pro(最新稳定版)
- gemini-1.5-pro-latest
- gemini-1.5-pro-001(稳定版)
- gemini-1.5-pro-002(稳定版)
定位和使用场景
能够一次处理大量数据,包括2小时的视频,19小时的音频,60,000行代码的代码库,或2,000页文本。适用于需要更高智能的复杂推理任务。
速率限制
文档
官方文档