大模型API价格对比

LLM API price comparison

Posted by shake on March 1, 2025

通过API调用大模型已经有一段时间,对于不同模型价格的差异,其实主观感受是:

  • openAI 4o-mini 使用基本不需要操心成本
  • 国内的厂商的api,使用也是基本不需要操心成本
  • Claude 3.5 Sonnet 用来写作,真的是有的肉疼。

业界大模型计算token,输入和输出的价格是不同。输出更贵。如果是使用H100作为推理卡,那么1百万token的产生成本,包括电费等,应该是5美元左右。

API 定价对比表 (按每1M tokens计价)

提供商 模型名称 输入价格 (缓存命中/未命中) 输出价格 上下文长度 备注
DeepSeek DeepSeek-V3 (deepseek-chat) $0.07 / $0.27 $1.10 128K 通用对话,性价比高,含缓存支持
  DeepSeek-R1 (deepseek-reasoner) $0.14 / $0.55 $2.19 64K 高级推理,含CoT,缓存支持
OpenAI GPT-4.5 $37.50 / $75.00 $150.00 未公开 最新聊天模型,高性能,含缓存支持
  GPT-4o $2.50 (无缓存区分) $10.00 128K 多模态,支持图像、文本
  GPT-4o mini $0.15 (无缓存区分) $0.60 128K 成本效益高,轻量任务
  GPT-4 Turbo $10.00 (无缓存区分) $30.00 128K 高性能,优化对话
  GPT-4 $30.00 (无缓存区分) $60.00 128K 经典高性能模型
  GPT-3.5 Turbo (0125) $0.50 (无缓存区分) $1.50 16K 对话优化,普及型
  o1 $15.00 (无缓存区分) $60.00 200K 复杂推理,顶级性能
  o1 mini $3.00 (无缓存区分) $12.00 200K 推理任务,成本效益高
Anthropic Claude 3.5 Sonnet $3.00 (无缓存区分) $15.00 200K 高性能,平衡速度与成本
  Claude 3 Opus $15.00 (无缓存区分) $75.00 200K 最强大模型,高级分析
  Claude 3 Haiku $0.25 (无缓存区分) $1.25 200K 轻量级,成本最低
  Claude 3.7 Sonnet $3.00 (无缓存区分) $15.00 200K 支持代码运行,含“思考token”
Google Gemini Gemini 1.0 Pro $0.50 (无缓存区分) $1.50 32K 首代模型,支持多模态
  Gemini 1.5 Flash $0.35 (无缓存区分) $1.05 1M 低延迟,成本效益高
  Gemini 1.5 Pro $3.50 (无缓存区分) $10.50 2M 高性能,超长上下文
  Gemini 2.0 Flash $0.15 (无缓存区分) $0.60 1M 原生工具使用,多模态
  Gemini 2.0 Flash Lite $0.075 (无缓存区分) $0.30 1M 最低成本生产可用模型
  Gemini 2.0 Pro 未公开 (实验性) 未公开 未公开 实验性,暂无定价

表格说明

  1. GPT-4.5 价格来源
    • 输入价格:$75.00/1M tokens(未命中缓存),$37.50/1M tokens(缓存命中),根据VentureBeat报道和X帖子(如@faraz0x)。
    • 输出价格:$150.00/1M tokens,同样来自上述来源。
    • 上下文长度:官方未明确公布,标记为“未公开”。
    • 备注:GPT-4.5是OpenAI最新聊天模型,支持缓存,被描述为“最大、最知识渊博”的模型,适用于ChatGPT Pro用户($200/月)及API开发者。
  2. 输入价格 (缓存命中/未命中)
    • DeepSeek和GPT-4.5区分缓存命中和未命中价格,缓存命中显著降低成本。
    • OpenAI其他模型、Anthropic和Gemini未提供缓存区分,输入价格统一列出。
  3. 上下文长度
    • 表示模型一次性可处理的token数量,Gemini 1.5 Pro (2M) 和 Anthropic 模型 (200K) 提供超长上下文,DeepSeek和OpenAI主流为128K。
  4. 货币单位
    • 所有价格以美元(USD)列出,未含税费(依地区可能不同)。

快速观察

  • 最低成本:Gemini 2.0 Flash Lite ($0.075 输入 / $0.30 输出) 和 DeepSeek-V3 (缓存命中 $0.07 输入 / $1.10 输出) 仍是最便宜选项。