new-api 系列(五):计价模型与成本控制
系列目录
计价基础
new-api 的「剩余额度」单位是美元。用户每次请求消耗的额度计算方式为:
消耗金额 = (输入 Token × 输入单价) + (输出 Token × 输出单价)
默认情况下,new-api 使用统一倍率:
| 项目 | 默认价格 |
|---|---|
| 输入 Token | $0.15 / 百万 Token |
| 输出 Token | $0.60 / 百万 Token |
这意味着默认配置下,用户消耗 100 万输入 Token 扣 $0.15,100 万输出 Token 扣 $0.60。
注意:如果不配置自定义价格,无论实际调用的是
gpt-4o(贵)还是gpt-4o-mini(便宜),扣费标准是一样的。生产环境强烈建议配置各模型的实际价格。
配置自定义模型价格
方式一:管理面板逐个设置
后台 →「设置」→「模型价格」:
| 字段 | 说明 | 示例 |
|---|---|---|
| 模型名 | 匹配规则,支持通配符 | gpt-4o、claude-* |
| 输入价格 | 每百万 Token 的美元价格 | 2.5 |
| 输出价格 | 每百万 Token 的美元价格 | 10.0 |
方式二:批量导入
new-api 支持通过 JSON 批量设置价格。在「模型价格」页面找到导入功能,粘贴:
[
{"model": "gpt-4o", "input_price": 2.5, "output_price": 10.0},
{"model": "gpt-4o-mini", "input_price": 0.15, "output_price": 0.60},
{"model": "claude-sonnet-4-6", "input_price": 3.0, "output_price": 15.0},
{"model": "claude-opus-4-8", "input_price": 15.0, "output_price": 75.0},
{"model": "deepseek-chat", "input_price": 0.14, "output_price": 0.28}
]
常见模型参考价格
截至 2026 年中,各主要模型的 API 官方定价(美元/百万 Token):
| 模型 | 输入价 | 输出价 | 备注 |
|---|---|---|---|
| gpt-4o | $2.50 | $10.00 | |
| gpt-4o-mini | $0.15 | $0.60 | |
| claude-sonnet-4-6 | $3.00 | $15.00 | |
| claude-opus-4-8 | $15.00 | $75.00 | 最贵 |
| claude-haiku | $0.80 | $4.00 | |
| deepseek-chat | $0.14 | $0.28 | 极便宜 |
| deepseek-reasoner | $0.55 | $2.19 | |
| gemini-3.5-flash | $0.10 | $0.40 |
价格会随官方调整变化,请以各提供商官网为准。
倍率(Markup)策略
如果你想让用户价格 = 成本价 × 倍率,new-api 支持分组倍率。
分组倍率
在「设置 → 分组倍率」里可以按模型分组设置乘数:
| 分组 | 倍率 | 效果 |
|---|---|---|
| 默认 | 1.0 | 原价 |
| VIP 用户 | 0.8 | 8 折 |
| 外部客户 | 1.5 | 加价 50% |
倍率会乘到对应分组内用户的每次请求上。
用户单独倍率
在用户编辑页面可以设置该用户专属倍率,覆盖分组倍率。适合特殊折扣或内部员工。
成本控制策略
策略一:额度上限
给每个令牌设置月度额度,是最直接的控成本手段。一个 5 人团队可以每人每月 10 美元额度,总预算 $50/月。
策略二:模型限制
给成本敏感用户限制只能调用便宜模型:
# 令牌模型白名单
gpt-4o-mini
deepseek-chat
claude-haiku-4-5-20251001
策略三:引导低成本模型
在模型别名中把便宜模型设为主推名:
# 渠道模型映射
default:gpt-4o-mini
fast:deepseek-chat
让用户习惯用 default 和 fast,而不是 gpt-4o。
策略四:余额预警
在「设置 → 通用设置」中配置余额预警阈值,当用户剩余额度低于设定值时会触发通知。
盈亏计算
估算上游成本
从 new-api 日志页面导出 CSV,统计每个模型的 Token 消耗量,乘以上游 API 实际费用。
# 示例:从日志 CSV 计算 gpt-4o 总消耗
# 假设导出的 CSV 包含 model, prompt_tokens, completion_tokens 列
# 用 awk 快速统计
awk -F, '/gpt-4o/ {input+=$3; output+=$4} END {
printf "input: %d tokens, output: %d tokens\n", input, output
printf "cost: $%.4f\n", (input/1000000)*2.5 + (output/1000000)*10.0
}' logs.csv
估算下游收入
同一份日志,用 new-api 配置的价格重新计算消耗金额,再减去上游成本 = 毛利。
收入 = sum(每位用户的额度消耗)
成本 = sum(上游 API 实际费用)
毛利 = 收入 - 成本
new-api 本身不提供财务报表功能,需要自己导出数据用 Excel 或脚本处理。如果有这个需求,可以关注社区开发的配套分析工具。
对不同受众的定价建议
| 受众 | 定价策略 | 说明 |
|---|---|---|
| 自己用 | 不设额度 | 简化操作 |
| 家人/好友 | 成本价(倍率 1.0) | 不赚钱,覆盖成本 |
| 小团队 | 成本价 + 固定月费 | 按月收取固定费用 + 按量计费 |
| 外部客户 | 成本价 × 1.3~2.0 | 覆盖运维 + 利润 |
| SaaS 集成 | 按量计费 + 订阅制 | API 服务化 |
系列导航
系列导航
- (一)认识 new-api——新一代 AI API 管理网关
- (二)安装部署——从零搭建 new-api
- (三)渠道配置——接入各类模型提供商
- (四)令牌与用户管理
- (五)计价模型与成本控制(本文)
- (六)监控、日志与告警
- (七)生产环境部署与安全加固
- (八)进阶——多实例、负载均衡与 SSO
- (九)接入国内支付——支付宝、微信与自动充值
- (十)接入国际支付——Stripe、PayPal 与海外收银
实操清单
- Claude、DeepSeek、Gemini 等主力模型的 ModelRatio 已配置
- Claude 系列 CacheRatio(缓存读取,0.1)和 CreateCacheRatio(缓存写入,1.25)已配置
- Claude 系列 CompletionRatio 已配置(约 5,反映输出 token 比输入贵)
- NewUserQuota 已设为 2,500,000(约 $2.5,新用户初始额度)
- 为不同用户组配置分组倍率(当前未设置,所有用户按相同倍率计费)
- 给高风险令牌或用户开启模型白名单,限制访问高价模型(Claude Opus 等)
- 给令牌设置额度上限(当前 id:4 令牌已出现负额度,说明无上限存在超支风险)
- 配置余额预警阈值(用户余额低于阈值时触发邮件通知)
- 从日志导出数据,对比 ModelRatio 计算值与 CLIProxyAPI / deepseek 实际账单,验证精度