new-api 系列(五):计价模型与成本控制

系列目录

  1. (一)认识 new-api——新一代 AI API 管理网关
  2. (二)安装部署——从零搭建 new-api
  3. (三)渠道配置——接入各类模型提供商
  4. (四)令牌与用户管理
  5. (五)计价模型与成本控制(本文)
  6. (六)监控、日志与告警
  7. (七)生产环境部署与安全加固
  8. (八)进阶——多实例、负载均衡与 SSO
  9. (九)接入国内支付——支付宝、微信与自动充值
  10. (十)接入国际支付——Stripe、PayPal 与海外收银

# 计价模型与成本控制 ## 计价基础 - 剩余额度单位:美元 - 消耗 = Token 数 × 模型单价 - 输入 / 输出 Token 分别计费 ## 定价方式 - 默认倍率:输入 $0.15 / 百万 Token - 自定义模型价格:逐个模型设置 - 分组倍率:批量调整 - 用户单独倍率 ## 成本控制 - 为用户设置额度上限 - 低成本模型默认策略 - 禁用高成本模型 - 额度预警 ## 盈亏计算 - 上游成本 = API 实际支出 - 下游收入 = 用户消耗额度 - 可从日志导出计算

计价基础

new-api 的「剩余额度」单位是美元。用户每次请求消耗的额度计算方式为:

消耗金额 = (输入 Token × 输入单价) + (输出 Token × 输出单价)

默认情况下,new-api 使用统一倍率:

项目 默认价格
输入 Token $0.15 / 百万 Token
输出 Token $0.60 / 百万 Token

这意味着默认配置下,用户消耗 100 万输入 Token 扣 $0.15,100 万输出 Token 扣 $0.60。

注意:如果不配置自定义价格,无论实际调用的是 gpt-4o(贵)还是 gpt-4o-mini(便宜),扣费标准是一样的。生产环境强烈建议配置各模型的实际价格。

flowchart LR REQ["用户请求\nmodel: gpt-4o"] --> NA["new-api"] NA --> COUNT["统计 Token 数\ninput: 500\noutput: 200"] COUNT --> CALC["计算金额\n500 × input_price\n200 × output_price"] CALC --> DEDUCT["从令牌额度扣除"] DEDUCT --> LOG["写入日志"]

配置自定义模型价格

方式一:管理面板逐个设置

后台 →「设置」→「模型价格」:

字段 说明 示例
模型名 匹配规则,支持通配符 gpt-4oclaude-*
输入价格 每百万 Token 的美元价格 2.5
输出价格 每百万 Token 的美元价格 10.0

方式二:批量导入

new-api 支持通过 JSON 批量设置价格。在「模型价格」页面找到导入功能,粘贴:

[
  {"model": "gpt-4o", "input_price": 2.5, "output_price": 10.0},
  {"model": "gpt-4o-mini", "input_price": 0.15, "output_price": 0.60},
  {"model": "claude-sonnet-4-6", "input_price": 3.0, "output_price": 15.0},
  {"model": "claude-opus-4-8", "input_price": 15.0, "output_price": 75.0},
  {"model": "deepseek-chat", "input_price": 0.14, "output_price": 0.28}
]

常见模型参考价格

截至 2026 年中,各主要模型的 API 官方定价(美元/百万 Token):

模型 输入价 输出价 备注
gpt-4o $2.50 $10.00
gpt-4o-mini $0.15 $0.60
claude-sonnet-4-6 $3.00 $15.00
claude-opus-4-8 $15.00 $75.00 最贵
claude-haiku $0.80 $4.00
deepseek-chat $0.14 $0.28 极便宜
deepseek-reasoner $0.55 $2.19
gemini-3.5-flash $0.10 $0.40

价格会随官方调整变化,请以各提供商官网为准。

倍率(Markup)策略

如果你想让用户价格 = 成本价 × 倍率,new-api 支持分组倍率。

分组倍率

在「设置 → 分组倍率」里可以按模型分组设置乘数:

分组 倍率 效果
默认 1.0 原价
VIP 用户 0.8 8 折
外部客户 1.5 加价 50%

倍率会乘到对应分组内用户的每次请求上。

用户单独倍率

在用户编辑页面可以设置该用户专属倍率,覆盖分组倍率。适合特殊折扣或内部员工。

flowchart LR BASE["模型基础价格\n如 gpt-4o: $2.50"] --> GROUP{"用户分组?"} GROUP -- 普通用户 --> M1["× 1.0 = $2.50"] GROUP -- VIP 用户 --> M2["× 0.8 = $2.00"] GROUP -- 外部客户 --> M3["× 1.5 = $3.75"] M1 --> DEDUCT["扣额度"] M2 --> DEDUCT M3 --> DEDUCT

成本控制策略

策略一:额度上限

给每个令牌设置月度额度,是最直接的控成本手段。一个 5 人团队可以每人每月 10 美元额度,总预算 $50/月。

策略二:模型限制

给成本敏感用户限制只能调用便宜模型:

# 令牌模型白名单
gpt-4o-mini
deepseek-chat
claude-haiku-4-5-20251001

策略三:引导低成本模型

在模型别名中把便宜模型设为主推名:

# 渠道模型映射
default:gpt-4o-mini
fast:deepseek-chat

让用户习惯用 defaultfast,而不是 gpt-4o

策略四:余额预警

在「设置 → 通用设置」中配置余额预警阈值,当用户剩余额度低于设定值时会触发通知。

盈亏计算

估算上游成本

从 new-api 日志页面导出 CSV,统计每个模型的 Token 消耗量,乘以上游 API 实际费用。

# 示例:从日志 CSV 计算 gpt-4o 总消耗
# 假设导出的 CSV 包含 model, prompt_tokens, completion_tokens 列

# 用 awk 快速统计
awk -F, '/gpt-4o/ {input+=$3; output+=$4} END {
  printf "input: %d tokens, output: %d tokens\n", input, output
  printf "cost: $%.4f\n", (input/1000000)*2.5 + (output/1000000)*10.0
}' logs.csv

估算下游收入

同一份日志,用 new-api 配置的价格重新计算消耗金额,再减去上游成本 = 毛利。

收入 = sum(每位用户的额度消耗)
成本 = sum(上游 API 实际费用)
毛利 = 收入 - 成本

new-api 本身不提供财务报表功能,需要自己导出数据用 Excel 或脚本处理。如果有这个需求,可以关注社区开发的配套分析工具。

对不同受众的定价建议

受众 定价策略 说明
自己用 不设额度 简化操作
家人/好友 成本价(倍率 1.0) 不赚钱,覆盖成本
小团队 成本价 + 固定月费 按月收取固定费用 + 按量计费
外部客户 成本价 × 1.3~2.0 覆盖运维 + 利润
SaaS 集成 按量计费 + 订阅制 API 服务化

系列导航

系列导航

实操清单

  • Claude、DeepSeek、Gemini 等主力模型的 ModelRatio 已配置
  • Claude 系列 CacheRatio(缓存读取,0.1)和 CreateCacheRatio(缓存写入,1.25)已配置
  • Claude 系列 CompletionRatio 已配置(约 5,反映输出 token 比输入贵)
  • NewUserQuota 已设为 2,500,000(约 $2.5,新用户初始额度)
  • 为不同用户组配置分组倍率(当前未设置,所有用户按相同倍率计费)
  • 给高风险令牌或用户开启模型白名单,限制访问高价模型(Claude Opus 等)
  • 给令牌设置额度上限(当前 id:4 令牌已出现负额度,说明无上限存在超支风险)
  • 配置余额预警阈值(用户余额低于阈值时触发邮件通知)
  • 从日志导出数据,对比 ModelRatio 计算值与 CLIProxyAPI / deepseek 实际账单,验证精度