模型概览
Grok-2-Image是xAI的专门图像生成模型,能够根据文本描述创建高质量图像。
主要特点
- 高创造性(4/4点评分)
- 中等速度(3/5闪电评分)
- 131,072上下文窗口
- 图像生成能力
- 2024年知识截止(估计)
- 支持文本输入
- 支持图像输出
技术规格
- 定价:每生成一张图像0.07美元
- 支持:输入:文本提示;输出:生成的图像
- 特点:高质量图像合成,创意生成,基于提示的控制
快照
- grok-2-image-1212
- grok-2-image(grok-2-image-latest的别名)
- grok-2-image-latest
定位和用例
Grok-2-Image专为需要从文本描述生成高质量图像的创意应用而设计。它擅长艺术创作、概念可视化、营销材料、产品模型和创意内容生成。该模型提供具有竞争力质量的成本效益图像合成,适用于专业创意工作流程和实验性艺术项目。
使用限制
额外技术说明
- 图像输入规格:每张图像最大10MiB,图像数量不限,支持JPG/JPEG和PNG格式
- 灵活输入顺序:文本和图像输入可以在对话中以任何顺序混合
- 模型版本控制:日期特定版本(例如-1212)提供一致性,而别名会自动更新到最新版本
- 上下文限制:Grok-2-Vision具有较小的上下文窗口(8K),相比其他模型(131K)
- 定价结构:图像生成使用按图像定价,而文本模型使用基于令牌的定价
文档
官方文档