Gemini 2.0 Flash Live

模型概述

Gemini 2.0 Flash Live 通过Live API实现与Gemini的低延迟双向语音和视频交互。

模型代码： gemini-2.0-flash-live-001
支持： 输入：音频、视频、文本；输出：文本和音频
功能： 结构化输出、函数调用、代码执行、搜索、音频生成
价格：
- 输入：$0.10每百万令牌（文本/图像/视频），$0.70每百万令牌（音频）
- 输出：$0.40每百万令牌
- 上下文缓存：$0.025/百万令牌（文本/图像/视频），$0.175/百万令牌（音频），$1.00/百万令牌每小时存储
- 图像生成：$0.039每张图片
- Live API：输入$0.35（文本），$2.10（音频/图像/视频）；输出$1.50（文本），$8.50（音频）
免费层级： 可用

专为实时语音和视频交互而设计。非常适合实时对话AI、虚拟助手、实时客户支持以及需要即时音频/视频处理的交互式应用。

由强大技术专长支持的下一代AI模型

参数量

Output tokens 8,192 tokens

Gemini 2.0 Flash Live 通过Live API实现与Gemini的低延迟双向语音和视频交互。

官方价格：$0.10 • $0.40 我们的价格：$0.08 • $0.32 节省 20%

返回列表立即尝试

常见问题

运行时间保证是什么？

我们通过企业级基础设施和冗余系统保证99.9%的运行时间。

如何计算价格？

定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。

GPT-4和GPT-4 Turbo之间有什么区别？

GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。