English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
English
中文
Deutsch
Português
Español
Français
Русский
한국어
日本語
注册

Gemini 1.5 Flash-8B

模型概述

Gemini 1.5 Flash-8B 是一款较小的模型,专为高容量和较低智能任务设计,具有成本效益。

主要特点

  • 中等智能(2/4点评级)
  • 非常快的速度(5/5闪电评级)
  • 1,048,576上下文窗口
  • 8,192最大输出标记
  • 知识截止日期未指定
  • 支持音频、图像、视频和文本输入
  • 支持文本输出

技术规格

  • 模型代码: gemini-1.5-flash-8b
  • 支持: 输入:音频、图像、视频、文本;输出:仅文本
  • 功能: 系统指令、JSON模式、JSON架构、可调安全设置、缓存、调优、函数调用、代码执行
  • 音频/视觉规格: 每个提示最多3,600张图像,1小时视频,约9.5小时音频
  • 定价:
    • 输入:$0.0375/百万标记(≤128k提示),$0.075/百万标记(>128k提示)
    • 输出:$0.15/百万标记(≤128k提示),$0.30/百万标记(>128k提示)
    • 上下文缓存:$0.01/百万标记(≤128k),$0.02/百万标记(>128k),$0.25/小时存储
  • 免费层级: 可用

快照版本

  • gemini-1.5-flash-8b(最新稳定版)
  • gemini-1.5-flash-8b-latest
  • gemini-1.5-flash-8b-001(稳定版)

定位和使用场景

针对高容量和较低智能任务进行优化。对于不需要高级推理的简单任务,是最具成本效益的选择。

速率限制

  • 适用标准速率限制

文档

官方文档

Google

由强大技术专长支持的下一代AI模型

Gemini 1.5 Flash-8B

参数量 Unknow
Output tokens 8,192 tokens

Gemini 1.5 Flash-8B 是一款较小的模型,专为高容量和较低智能任务设计,具有成本效益。

官方价格:$0.0375 • $0.15 我们的价格:$0.03 • $0.12 节省 20%

常见问题

运行时间保证是什么?
我们通过企业级基础设施和冗余系统保证99.9%的运行时间。
如何计算价格?
定价基于处理的令牌数量。最终成本中既包括输入令牌也包括输出令牌。
GPT-4和GPT-4 Turbo之间有什么区别?
GPT-4 Turbo是具有改进性能、更长上下文窗口和更近知识截止日期的最新版本。