DeepSeek官方测算模型成本利润率为545%

3月1日，DeepSeek官方通过社交媒体账号公布了其线上系统的实际统计数据，称如果所有tokens全部按照DeepSeek R1的定价计算，理论上成本利润率为545%。

DeepSeek官方公布，DeepSeek V3和R1的所有服务均使用H800 GPU，使用和训练一致的精度，即矩阵计算和dispatch传输采用和训练一致的FP8格式，core-attention计算和combine传输采用和训练一致的BF16，最大程度保证了服务效果。

另外，由于白天的服务负荷高，晚上的服务负荷低，因此DeepSeek实现了一套机制，在白天负荷高的时候，用所有节点部署推理服务。晚上负荷低的时候，减少推理节点，以用来做研究和训练。在最近的24小时里（北京时间 2025/02/27 12:00 至 2025/02/28 12:00），DeepSeek V3和R1推理服务占用节点总和，峰值占用为278个节点，平均占用226.75个节点（每个节点为 8 个 H800 GPU）。假定GPU租赁成本为2美金/小时，总成本为$87,072/天。

在24小时统计时段内，DeepSeek V3和R1：

输入token总数为608B，其中342B tokens（56.3%）命中KVCache硬盘缓存。

输出token总数为168B。平均输出速率为20~22 tps，平均每输出一个token的KVCache长度是4989。

平均每台H800的吞吐量为：对于prefill任务，输入吞吐约73.7k tokens/s（含缓存命中）；对于decode任务，输出吞吐约14.8k tokens/s。

以上统计包括了网页、APP和API的所有负载。如果所有tokens全部按照DeepSeek R1的定价计算，理论上一天的总收入为$562,027，成本利润率545%。

DeepSeek官方表示，实际上没有这么多收入，因为V3的定价更低，同时收费服务只占了一部分，另外夜间还会有折扣。

本文系观察者网独家稿件，未经授权，不得转载。