模型概览
Gemini 2.5 Flash Preview TTS 是 Google 的高性价比文本转语音模型,为结构化工作流程提供高控制性和透明度。
主要特性
- 高质量的 TTS 功能
- 低延迟音频生成
- 8,000 输入令牌限制
- 16,000 输出令牌限制
- 支持文本输入
- 支持音频输出
技术规格
- 模型代码: gemini-2.5-flash-preview-tts
- 支持: 输入: 文本; 输出: 音频
- 特性: 音频生成,可控的单speaker和多speaker文本转语音
- 价格:
- 输入: $0.50 每 1M 令牌(文本)
- 输出: $10.00 每 1M 令牌(音频)
- 免费层级: 不可用
快照
- gemini-2.5-flash-preview-tts
定位与使用场景
非常适合结构化工作流程,如播客生成、有声读物、客户支持,以及其他需要高质量文本转语音转换并具备控制性和透明度的应用。
速率限制
文档
官方文档