3月1日中午,DeepSeek在知乎平台发布首条文章,公布模型推理成本利润细节,并披露成本利润率关键信息。DeepSeek称,假定GPU租赁成本为2美元/小时,总成本为87072美元/天……统计包括网页、App和API在内的所有负载,如果所有tokens全部按照DeepSeek-R1的定价计算,理论上一天的总收入为562027美元,成本利润率为545%。

文章一经发出,不少网友纷纷在评论区@尤洋。尤洋是潞晨科技创始人。此前,尤洋公开表示,卖DeepSeek API(MaaS)每月亏本4亿元。该消息一度引起轰动。目前,尤洋已回应称,“由于多人at我,我今天(3月1日)之内会直接地回复一下”。


理论上一天的成本利润率为545%

文章中,DeepSeek首次披露成本利润率关键信息。DeepSeek统计了在24小时统计时段内DeepSeek-V3和R1网页、App和API的所有负载,所有tokens按照DeepSeek-R1的定价,并假定GPU租赁成本为2美元/小时,总成本为87072美元一天。DeepSeek称理论上一天的成本利润率为545%。

其中,DeepSeek称,在最近的24小时里(北京时间2025/02/27 12:00至2025/02/28 12:00),DeepSeek-V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点。DeepSeek-R1的定价为0.14美元/百万输入tokens(缓存命中),0.55美元/百万输入tokens(缓存未命中),2.19美元/百万输出tokens。

DeepSeek补充到,当然公司实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。


DeepSeek表示,DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。文章主要内容为如何使用EP(大规模跨节点专家并行)增大batch size(批量大小,每个batch中的样本数量),如何隐藏传输的耗时,如何进行负载均衡。


不贴钱,也不赚取暴利

此前,尤洋称,卖DeepSeek API(MaaS)每月亏本4亿元。该消息引起人们对于DeepSeek盈利话题的热议。

尤洋称,DeepSeek API(MaaS)按照2025年2月初的状态不可能盈利。亏损来源一是测试速度和实际场景的差距,二是机器利用率峰值和波谷的巨大差距,三是机器的不稳定性。

DeepSeek在最新文章中表示,白天高负荷时全节点部署推理,夜间低负荷时释放节点用于训练/研究。全天峰值278节点,平均226.75节点。业内人士表示,这疑似回应质疑,DeepSeek文章内容证明资源弹性伸缩有效,避免了资源长期空置。

关于盈利话题,DeepSeek创始人梁文锋曾公开表示,“我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。”

去年5月,时任DeepSeek员工的罗福莉在知乎透露称,“大家不用担心模型断更,也不用担心API涨价(目前就是大规模服务的价格,不亏本,利润率超50%)”。

“这篇文章估计今年会被做在线推理和私有化部署的群转爆,因为大家可以看到他们踩的坑和让出的利润。”业内人士表示,“其实这个钱不好赚的,除非能够持续地吸引用户都来用一方的API ,持续进化模型,保持领先。”

同时,在部分业内人士看来,人工智能领域的盈利并非只考虑技术能力,商务付费能力和应用场景也极为关键。


开源周收官

此时,DeepSeek刚结束为期5天的“开源周”。

2月28日,“开源周”第五天,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。Fire-Flyer文件系统(3FS)是一种利用现代SSD和RDMA网络的全部带宽的并行文件系统,是所有DeepSeek数据访问的助推器。

此前,DeepSeek宣布,从2月24日起将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展。

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。DeepSeek称,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。

2月25日,DeepSeek开源了DeepEP。据介绍,这是首个用于MoE模型训练和推理的开源EP通信库,用于训练和推理的高吞吐量和低延迟。

2月26日,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等。

2月27日,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题。

QuestMobile数据显示,自上线以来至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万个。

“开源技术正从代码共享迈向实体创新,成为推动智能未来的关键力量。开源硬件为技术创新提供了自由与灵活性,而中国开源生态的发展,如DeepSeek的成功,展现了开源从‘运营驱动’向‘价值驱动’的转变。”上海开源信息技术协会秘书长朱其罡称。

来源:上海证券报 原标题《DeepSeek发文!首次披露关键信息》

⭐星标华尔街见闻,好内容不错过

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

觉得好看,请点“在看”

ad1 webp
ad2 webp
ad1 webp
ad2 webp