模型概览
GPT-4o mini Audio 是一个能够处理音频输入和输出的较小模型。
主要特点
- 128,000上下文窗口
- 16,384最大输出令牌
- 2023年10月1日知识截止日期
- 具有快速处理能力的一般智能水平
技术规格
- 文本输入价格: 每百万令牌$0.15
- 文本输出价格: 每百万令牌$0.60
- 音频输入价格: 每百万令牌$10.00
- 音频输出价格: 每百万令牌$20.00
- 支持: 输入:文本和音频,输出:文本和音频
- 功能: 支持流式处理,函数调用
快照
- gpt-4o-mini-audio-preview
- gpt-4o-mini-audio-preview-2024-12-17
定位和使用场景
这是较小的GPT-4o Audio mini模型的预览版本。它设计用于通过REST API输入音频或创建音频输出。
官方文档