通过API调用大模型已经有一段时间,对于不同模型价格的差异,其实主观感受是:
- openAI 4o-mini 使用基本不需要操心成本
- 国内的厂商的api,使用也是基本不需要操心成本
- Claude 3.5 Sonnet 用来写作,真的是有的肉疼。
业界大模型计算token,输入和输出的价格是不同。输出更贵。如果是使用H100作为推理卡,那么1百万token的产生成本,包括电费等,应该是5美元左右。
API 定价对比表 (按每1M tokens计价)
提供商 | 模型名称 | 输入价格 (缓存命中/未命中) | 输出价格 | 上下文长度 | 备注 |
---|---|---|---|---|---|
DeepSeek | DeepSeek-V3 (deepseek-chat) | $0.07 / $0.27 | $1.10 | 128K | 通用对话,性价比高,含缓存支持 |
DeepSeek-R1 (deepseek-reasoner) | $0.14 / $0.55 | $2.19 | 64K | 高级推理,含CoT,缓存支持 | |
OpenAI | GPT-4.5 | $37.50 / $75.00 | $150.00 | 未公开 | 最新聊天模型,高性能,含缓存支持 |
GPT-4o | $2.50 (无缓存区分) | $10.00 | 128K | 多模态,支持图像、文本 | |
GPT-4o mini | $0.15 (无缓存区分) | $0.60 | 128K | 成本效益高,轻量任务 | |
GPT-4 Turbo | $10.00 (无缓存区分) | $30.00 | 128K | 高性能,优化对话 | |
GPT-4 | $30.00 (无缓存区分) | $60.00 | 128K | 经典高性能模型 | |
GPT-3.5 Turbo (0125) | $0.50 (无缓存区分) | $1.50 | 16K | 对话优化,普及型 | |
o1 | $15.00 (无缓存区分) | $60.00 | 200K | 复杂推理,顶级性能 | |
o1 mini | $3.00 (无缓存区分) | $12.00 | 200K | 推理任务,成本效益高 | |
Anthropic | Claude 3.5 Sonnet | $3.00 (无缓存区分) | $15.00 | 200K | 高性能,平衡速度与成本 |
Claude 3 Opus | $15.00 (无缓存区分) | $75.00 | 200K | 最强大模型,高级分析 | |
Claude 3 Haiku | $0.25 (无缓存区分) | $1.25 | 200K | 轻量级,成本最低 | |
Claude 3.7 Sonnet | $3.00 (无缓存区分) | $15.00 | 200K | 支持代码运行,含“思考token” | |
Google Gemini | Gemini 1.0 Pro | $0.50 (无缓存区分) | $1.50 | 32K | 首代模型,支持多模态 |
Gemini 1.5 Flash | $0.35 (无缓存区分) | $1.05 | 1M | 低延迟,成本效益高 | |
Gemini 1.5 Pro | $3.50 (无缓存区分) | $10.50 | 2M | 高性能,超长上下文 | |
Gemini 2.0 Flash | $0.15 (无缓存区分) | $0.60 | 1M | 原生工具使用,多模态 | |
Gemini 2.0 Flash Lite | $0.075 (无缓存区分) | $0.30 | 1M | 最低成本生产可用模型 | |
Gemini 2.0 Pro | 未公开 (实验性) | 未公开 | 未公开 | 实验性,暂无定价 |
表格说明
- GPT-4.5 价格来源:
- 输入价格:$75.00/1M tokens(未命中缓存),$37.50/1M tokens(缓存命中),根据VentureBeat报道和X帖子(如@faraz0x)。
- 输出价格:$150.00/1M tokens,同样来自上述来源。
- 上下文长度:官方未明确公布,标记为“未公开”。
- 备注:GPT-4.5是OpenAI最新聊天模型,支持缓存,被描述为“最大、最知识渊博”的模型,适用于ChatGPT Pro用户($200/月)及API开发者。
- 输入价格 (缓存命中/未命中):
- DeepSeek和GPT-4.5区分缓存命中和未命中价格,缓存命中显著降低成本。
- OpenAI其他模型、Anthropic和Gemini未提供缓存区分,输入价格统一列出。
- 上下文长度:
- 表示模型一次性可处理的token数量,Gemini 1.5 Pro (2M) 和 Anthropic 模型 (200K) 提供超长上下文,DeepSeek和OpenAI主流为128K。
- 货币单位:
- 所有价格以美元(USD)列出,未含税费(依地区可能不同)。
快速观察
- 最低成本:Gemini 2.0 Flash Lite ($0.075 输入 / $0.30 输出) 和 DeepSeek-V3 (缓存命中 $0.07 输入 / $1.10 输出) 仍是最便宜选项。