English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
注册

Gemini 2.5 Flash Preview TTS

模型概览

Gemini 2.5 Flash Preview TTS 是 Google 的高性价比文本转语音模型,为结构化工作流程提供高控制性和透明度。

主要特性

  • 高质量的 TTS 功能
  • 低延迟音频生成
  • 8,000 输入令牌限制
  • 16,000 输出令牌限制
  • 支持文本输入
  • 支持音频输出

技术规格

  • 模型代码: gemini-2.5-flash-preview-tts
  • 支持: 输入: 文本; 输出: 音频
  • 特性: 音频生成,可控的单speaker和多speaker文本转语音
  • 价格:
    • 输入: $0.50 每 1M 令牌(文本)
    • 输出: $10.00 每 1M 令牌(音频)
  • 免费层级: 不可用

快照

  • gemini-2.5-flash-preview-tts

定位与使用场景

非常适合结构化工作流程,如播客生成、有声读物、客户支持,以及其他需要高质量文本转语音转换并具备控制性和透明度的应用。

速率限制

  • 由于是实验性/预览版模型,具有更严格的速率限制

文档

官方文档

Google

由强大技术专长支持的下一代AI模型

Gemini 2.5 Flash Preview TTS

参数量 Unknow
Output tokens 16,000 tokens

Gemini 2.5 Flash Preview TTS 是 Google 的高性价比文本转语音模型,为结构化工作流程提供高控制性和透明度。

官方价格:$0.50 • $10.00 我们的价格:$0.40 • $8.00 节省 20%

常见问题

运行时间保证是什么?
我们通过企业级基础设施和冗余系统保证99.9%的运行时间。
如何计算价格?
定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。
GPT-4和GPT-4 Turbo之间有什么区别?
GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。