模型概述
DeepSeek-R1 (deepseek-reasoner) 是一种先进的专注于推理的大型语言模型,专为具有明确思维链能力的复杂问题解决而设计。
主要特点
- 非常高的智能水平(4/4点评分)
- 中等速度(3/5闪电评分)
- 64,000上下文窗口
- 8,192最大输出令牌
- 32,768最大思维链长度
- 2023年知识截止(估计)
- 支持文本输入
- 支持文本输出
技术规格
- 价格:
- 标准时段(北京时间08:30-00:30):
- 每1M令牌$0.138(命中缓存的输入)
- 每1M令牌$0.551(未命中缓存的输入)
- 每1M令牌$2.204(输出)
- 优惠时段(北京时间00:30-08:30):
- 每1M令牌$0.034(命中缓存的输入)
- 每1M令牌$0.138(未命中缓存的输入)
- 每1M令牌$0.551(输出)
- 支持: 输入:文本;输出:带有明确推理步骤的文本
- 特性: 思维链推理,上下文缓存,逐步问题解决
版本快照
定位和使用场景
DeepSeek-R1定位为需要高级推理能力任务的专用模型。它在数学问题解决、逻辑推理、复杂决策制定和逐步分析方面表现出色。该模型独特的思维链特性使其在教育应用、科学研究、金融分析以及任何需要推理过程透明度的领域特别有价值。与标准LLMs不同,DeepSeek-R1在提供最终答案前明确展示其推理步骤,使其在高风险决策场景中更加可靠。
速率限制
附加说明
- 思维链指的是模型在提供正式答案前的明确推理过程
- 输出令牌计数包括思维链令牌和最终答案令牌
- 如果用户未指定,默认最大输出长度为4K令牌
- 该模型可以生成最多32K令牌的推理步骤,使其适合极其复杂的问题
- 上下文缓存功能有助于减少重复或类似查询的成本
- 当充值余额和奖励余额同时存在时,会先扣除奖励余额
- 特别适合学术研究、科学计算和企业决策
文档
官方文档