English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
注册

deepseek-reasoner

模型概述

DeepSeek-R1 (deepseek-reasoner) 是一种先进的专注于推理的大型语言模型,专为具有明确思维链能力的复杂问题解决而设计。

主要特点

  • 非常高的智能水平(4/4点评分)
  • 中等速度(3/5闪电评分)
  • 64,000上下文窗口
  • 8,192最大输出令牌
  • 32,768最大思维链长度
  • 2023年知识截止(估计)
  • 支持文本输入
  • 支持文本输出

技术规格

  • 价格:
    • 标准时段(北京时间08:30-00:30):
      • 每1M令牌$0.138(命中缓存的输入)
      • 每1M令牌$0.551(未命中缓存的输入)
      • 每1M令牌$2.204(输出)
    • 优惠时段(北京时间00:30-08:30):
      • 每1M令牌$0.034(命中缓存的输入)
      • 每1M令牌$0.138(未命中缓存的输入)
      • 每1M令牌$0.551(输出)
  • 支持: 输入:文本;输出:带有明确推理步骤的文本
  • 特性: 思维链推理,上下文缓存,逐步问题解决

版本快照

  • deepseek-reasoner(当前版本)

定位和使用场景

DeepSeek-R1定位为需要高级推理能力任务的专用模型。它在数学问题解决、逻辑推理、复杂决策制定和逐步分析方面表现出色。该模型独特的思维链特性使其在教育应用、科学研究、金融分析以及任何需要推理过程透明度的领域特别有价值。与标准LLMs不同,DeepSeek-R1在提供最终答案前明确展示其推理步骤,使其在高风险决策场景中更加可靠。

速率限制

  • 信息尚未公开可用

附加说明

  • 思维链指的是模型在提供正式答案前的明确推理过程
  • 输出令牌计数包括思维链令牌和最终答案令牌
  • 如果用户未指定,默认最大输出长度为4K令牌
  • 该模型可以生成最多32K令牌的推理步骤,使其适合极其复杂的问题
  • 上下文缓存功能有助于减少重复或类似查询的成本
  • 当充值余额和奖励余额同时存在时,会先扣除奖励余额
  • 特别适合学术研究、科学计算和企业决策

文档

官方文档

DeepSeek

大型语言模型开发领域的新兴领导者

deepseek-reasoner

参数量 236B
Output tokens 8,192 tokens

DeepSeek-R1 (deepseek-reasoner) 是一种先进的专注于推理的大型语言模型,专为具有明确思维链能力的复杂问题解决而设计。

官方价格:$0.138 • $2.204 我们的价格:$0.1104 • $1.7632 节省 20%

常见问题

运行时间保证是什么?
我们通过企业级基础设施和冗余系统保证99.9%的运行时间。
如何计算价格?
定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。
GPT-4和GPT-4 Turbo之间有什么区别?
GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。