模型概述
o1系列模型通过强化学习训练,能够执行复杂的推理。o1模型会在回答前思考,在回应用户前产生长链的内部思维过程。
主要特点
- 100,000最大输出tokens
- 2023年10月1日知识截止
- 通过强化学习训练
- 产生内部思维链
- 先前完整的o系列推理模型
技术规格
- 输入价格: $15.00每百万tokens
- 输出价格: $60.00每百万tokens
- 支持: 文本输入,文本输出
- 特性: 支持函数调用,结构化输出;不支持蒸馏和预测输出
快照
定位和使用场景
作为先前完整的o系列推理模型,o1设计用于需要复杂推理和详细思考过程的任务。
官方文档