English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
注册

Whisper

Whisper

模型概述

型号功能概括

Whisper是一款通用途用途的语音识别模型。您还可以将其用作为多任务模型来执行多语言语音识认以及语言间互译和语言识别。

关键特性

  • 平均性能 (2/4 点标级)
  • 中等速度 (3/5 闪电标级)
  • 通用语音识别模型
  • 接受音频输入并产生文本输出
  • 支持转录和翻译
  • 多语言能力

技术规格

  • 定价: $0.006 每1M令牌(转录)
  • 支持: 输入: 仅音频; 输出: 仅文本
  • 功能: 通过v1/audio/transcriptions端点转录, 通过v1/audio/translations端点翻译

快照

  • whisper-1

定位和使用场景

Whisper是一个通用的语音识别模型,在多样化音频的大型数据集上训练而成。它可用于多语言语音识别、语音翻译和语言识别。

速率限制

  • 免费层: 3 RPM, 200 RPD
  • 第1层: 500 RPM
  • 第2层: 2,500 RPM
  • 第3层: 5,000 RPM
  • 第4层: 7,500 RPM
  • 第5层: 10,000 RPM

文档

官方文档

OpenAI

AI先驱,因GPT系列模型而享誉全球

Whisper

参数量 Unknow

Whisper General-purpose speech recognition model

官方价格:$0.006 我们的价格:$0.0048 节省 20%

常见问题

运行时间保证是什么?
我们通过企业级基础设施和冗余系统保证99.9%的运行时间。
如何计算价格?
定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。
GPT-4和GPT-4 Turbo之间有什么区别?
GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。