new-api 系列（五）：计价模型与成本控制

2026年6月6日 12:00 CST new-api计价模型成本控制Token计费定价策略教程

系列目录

（一）认识 new-api——新一代 AI API 管理网关

（二）安装部署——从零搭建 new-api

（三）渠道配置——接入各类模型提供商

（四）令牌与用户管理

（五）计价模型与成本控制（本文）

（六）监控、日志与告警

（七）生产环境部署与安全加固

（八）进阶——多实例、负载均衡与 SSO

（九）接入国内支付——支付宝、微信与自动充值

（十）接入国际支付——Stripe、PayPal 与海外收银

# 计价模型与成本控制 ## 计价基础 - 剩余额度单位：美元 - 消耗 = Token 数 × 模型单价 - 输入 / 输出 Token 分别计费 ## 定价方式 - 默认倍率：输入 $0.15 / 百万 Token - 自定义模型价格：逐个模型设置 - 分组倍率：批量调整 - 用户单独倍率 ## 成本控制 - 为用户设置额度上限 - 低成本模型默认策略 - 禁用高成本模型 - 额度预警 ## 盈亏计算 - 上游成本 = API 实际支出 - 下游收入 = 用户消耗额度 - 可从日志导出计算

计价基础

new-api 的「剩余额度」单位是美元。用户每次请求消耗的额度计算方式为：

消耗金额 = (输入 Token × 输入单价) + (输出 Token × 输出单价)

默认情况下，new-api 使用统一倍率：

项目	默认价格
输入 Token	$0.15 / 百万 Token
输出 Token	$0.60 / 百万 Token

这意味着默认配置下，用户消耗 100 万输入 Token 扣 $0.15，100 万输出 Token 扣 $0.60。

注意：如果不配置自定义价格，无论实际调用的是 gpt-4o（贵）还是 gpt-4o-mini（便宜），扣费标准是一样的。生产环境强烈建议配置各模型的实际价格。

flowchart LR REQ["用户请求\nmodel: gpt-4o"] --> NA["new-api"] NA --> COUNT["统计 Token 数\ninput: 500\noutput: 200"] COUNT --> CALC["计算金额\n500 × input_price\n200 × output_price"] CALC --> DEDUCT["从令牌额度扣除"] DEDUCT --> LOG["写入日志"]

配置自定义模型价格

方式一：管理面板逐个设置

后台 →「设置」→「模型价格」：

字段	说明	示例
模型名	匹配规则，支持通配符	`gpt-4o`、`claude-*`
输入价格	每百万 Token 的美元价格	`2.5`
输出价格	每百万 Token 的美元价格	`10.0`

方式二：批量导入

new-api 支持通过 JSON 批量设置价格。在「模型价格」页面找到导入功能，粘贴：

[
  {"model": "gpt-4o", "input_price": 2.5, "output_price": 10.0},
  {"model": "gpt-4o-mini", "input_price": 0.15, "output_price": 0.60},
  {"model": "claude-sonnet-4-6", "input_price": 3.0, "output_price": 15.0},
  {"model": "claude-opus-4-8", "input_price": 15.0, "output_price": 75.0},
  {"model": "deepseek-chat", "input_price": 0.14, "output_price": 0.28}
]

常见模型参考价格

截至 2026 年中，各主要模型的 API 官方定价（美元/百万 Token）：

模型	输入价	输出价	备注
gpt-4o	$2.50	$10.00
gpt-4o-mini	$0.15	$0.60
claude-sonnet-4-6	$3.00	$15.00
claude-opus-4-8	$15.00	$75.00	最贵
claude-haiku	$0.80	$4.00
deepseek-chat	$0.14	$0.28	极便宜
deepseek-reasoner	$0.55	$2.19
gemini-3.5-flash	$0.10	$0.40

价格会随官方调整变化，请以各提供商官网为准。

倍率（Markup）策略

如果你想让用户价格 = 成本价 × 倍率，new-api 支持分组倍率。

分组倍率

在「设置 → 分组倍率」里可以按模型分组设置乘数：

分组	倍率	效果
默认	1.0	原价
VIP 用户	0.8	8 折
外部客户	1.5	加价 50%

倍率会乘到对应分组内用户的每次请求上。

用户单独倍率

在用户编辑页面可以设置该用户专属倍率，覆盖分组倍率。适合特殊折扣或内部员工。

flowchart LR BASE["模型基础价格\n如 gpt-4o: $2.50"] --> GROUP{"用户分组?"} GROUP -- 普通用户 --> M1["× 1.0 = $2.50"] GROUP -- VIP 用户 --> M2["× 0.8 = $2.00"] GROUP -- 外部客户 --> M3["× 1.5 = $3.75"] M1 --> DEDUCT["扣额度"] M2 --> DEDUCT M3 --> DEDUCT

成本控制策略

策略一：额度上限

给每个令牌设置月度额度，是最直接的控成本手段。一个 5 人团队可以每人每月 10 美元额度，总预算 $50/月。

策略二：模型限制

给成本敏感用户限制只能调用便宜模型：

# 令牌模型白名单
gpt-4o-mini
deepseek-chat
claude-haiku-4-5-20251001

策略三：引导低成本模型

在模型别名中把便宜模型设为主推名：

# 渠道模型映射
default:gpt-4o-mini
fast:deepseek-chat

让用户习惯用 default 和 fast，而不是 gpt-4o。

策略四：余额预警

在「设置 → 通用设置」中配置余额预警阈值，当用户剩余额度低于设定值时会触发通知。

盈亏计算

估算上游成本

从 new-api 日志页面导出 CSV，统计每个模型的 Token 消耗量，乘以上游 API 实际费用。

# 示例：从日志 CSV 计算 gpt-4o 总消耗
# 假设导出的 CSV 包含 model, prompt_tokens, completion_tokens 列

# 用 awk 快速统计
awk -F, '/gpt-4o/ {input+=$3; output+=$4} END {
  printf "input: %d tokens, output: %d tokens\n", input, output
  printf "cost: $%.4f\n", (input/1000000)*2.5 + (output/1000000)*10.0
}' logs.csv

估算下游收入

同一份日志，用 new-api 配置的价格重新计算消耗金额，再减去上游成本 = 毛利。

收入 = sum(每位用户的额度消耗)
成本 = sum(上游 API 实际费用)
毛利 = 收入 - 成本

new-api 本身不提供财务报表功能，需要自己导出数据用 Excel 或脚本处理。如果有这个需求，可以关注社区开发的配套分析工具。

对不同受众的定价建议

受众	定价策略	说明
自己用	不设额度	简化操作
家人/好友	成本价（倍率 1.0）	不赚钱，覆盖成本
小团队	成本价 + 固定月费	按月收取固定费用 + 按量计费
外部客户	成本价 × 1.3~2.0	覆盖运维 + 利润
SaaS 集成	按量计费 + 订阅制	API 服务化

系列导航

实操清单

Claude、DeepSeek、Gemini 等主力模型的 ModelRatio 已配置
Claude 系列 CacheRatio（缓存读取，0.1）和 CreateCacheRatio（缓存写入，1.25）已配置
Claude 系列 CompletionRatio 已配置（约 5，反映输出 token 比输入贵）
NewUserQuota 已设为 2,500,000（约 $2.5，新用户初始额度）
为不同用户组配置分组倍率（当前未设置，所有用户按相同倍率计费）
给高风险令牌或用户开启模型白名单，限制访问高价模型（Claude Opus 等）
给令牌设置额度上限（当前 id:4 令牌已出现负额度，说明无上限存在超支风险）
配置余额预警阈值（用户余额低于阈值时触发邮件通知）
从日志导出数据，对比 ModelRatio 计算值与 CLIProxyAPI / deepseek 实际账单，验证精度