deepseek-reasoner

模型概述

DeepSeek-R1 (deepseek-reasoner) 是一种先进的专注于推理的大型语言模型，专为具有明确思维链能力的复杂问题解决而设计。

主要特点

非常高的智能水平（4/4点评分）
中等速度（3/5闪电评分）
64,000上下文窗口
8,192最大输出令牌
32,768最大思维链长度
2023年知识截止（估计）
支持文本输入
支持文本输出

技术规格

价格:
- 标准时段（北京时间08:30-00:30）:
  - 每1M令牌$0.138（命中缓存的输入）
  - 每1M令牌$0.551（未命中缓存的输入）
  - 每1M令牌$2.204（输出）
- 优惠时段（北京时间00:30-08:30）:
  - 每1M令牌$0.034（命中缓存的输入）
  - 每1M令牌$0.138（未命中缓存的输入）
  - 每1M令牌$0.551（输出）
支持: 输入：文本；输出：带有明确推理步骤的文本
特性: 思维链推理，上下文缓存，逐步问题解决

版本快照

deepseek-reasoner（当前版本）

定位和使用场景

DeepSeek-R1定位为需要高级推理能力任务的专用模型。它在数学问题解决、逻辑推理、复杂决策制定和逐步分析方面表现出色。该模型独特的思维链特性使其在教育应用、科学研究、金融分析以及任何需要推理过程透明度的领域特别有价值。与标准LLMs不同，DeepSeek-R1在提供最终答案前明确展示其推理步骤，使其在高风险决策场景中更加可靠。

速率限制

信息尚未公开可用

附加说明

思维链指的是模型在提供正式答案前的明确推理过程
输出令牌计数包括思维链令牌和最终答案令牌
如果用户未指定，默认最大输出长度为4K令牌
该模型可以生成最多32K令牌的推理步骤，使其适合极其复杂的问题
上下文缓存功能有助于减少重复或类似查询的成本
当充值余额和奖励余额同时存在时，会先扣除奖励余额
特别适合学术研究、科学计算和企业决策

文档

官方文档

DeepSeek

大型语言模型开发领域的新兴领导者

deepseek-reasoner

参数量 236B

Output tokens 8,192 tokens

DeepSeek-R1 (deepseek-reasoner) 是一种先进的专注于推理的大型语言模型，专为具有明确思维链能力的复杂问题解决而设计。

官方价格：$0.138 • $2.204 我们的价格：$0.1104 • $1.7632 节省 20%

返回列表立即尝试

常见问题

运行时间保证是什么？

我们通过企业级基础设施和冗余系统保证99.9%的运行时间。

如何计算价格？

定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。

GPT-4和GPT-4 Turbo之间有什么区别？

GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。