(图片来源:wired)
这个周末,DeepSeek这条AI“鲶鱼”又搅动了 AI 行业一轮热战。
3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。
值得关注的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,DeepSeek使用了大规模跨节点专家并行(EP)的方法,并通过一系列技术策略,最大程度地优化了大模型推理系统,实现了惊人的性能和效率。假定GPU租赁成本为2美元/小时,总成本为87072美元/天;如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。
这是DeepSeek首次回应API本身利润的话题。钛媒体AGI计算了一下,以此计算,DeepSeek R1一年内对外API成本约3764万美元,约合人民币2.7亿元。
早前,钛媒体AGI深度报道称,腾讯、华为等公司接入DeepSeek,每月亏损超4亿元。
潞晨科技创始人、CEO尤洋博士表示,短期内,中国的MaaS模式可能是最差的商业模式,大厂相互卷低价和免费,满血版DeepSeek R1每百万token(输出)只收16元。如果每日输出1000亿token,基于DeepSeek的服务每月的机器成本是4.5亿元,亏损4亿元;用AMD芯片月收入4500万元,月机器成本2.7亿元,这意味着亏损也超过2亿元。
“用户越多,亏损越多。现金流能撑住吗?除非有免费的机器,但没有长久免费的午餐。”尤洋表示。(详见钛媒体App前文:《腾讯、华为等接入DeepSeek每月亏损超4亿,MaaS模型即服务将要被颠覆了?》)
这一报道引发关注,2月20日“腾讯华为等接入DeepSeek每月亏超4亿”话题登上了微博热搜第一名。随后,尤洋也发视频回应此事,他表示4亿亏损是经过精确计算的,“它(MaaS)可能太烧钱了”。
“4台H800机器+满血版DeepSeek,我们实测大概每秒只能输出1000个token,可想而知,每天你要输出1,000亿个token,每天就是1亿多,每台机器按每秒300块计算,4台机器每天就是1亿元。4000、5000台计算,根据H800的市场价或者按照折旧,每个月大概就是4.5亿元。”尤洋表示。
不过,另一家与潞晨处于竞争关系的AI Infra公司硅基流动创始人、CEO袁进辉表示不同意他的说法。
随着DeepSeek对成本利润的回应,尤洋、袁进辉两家公司创始人隔空发文,并且在朋友圈和知乎上互怼。
首先,袁进辉对于DeepSeek表达感激,并评论称:
“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert 组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。这些成果充分体现了DeepSeek团队第一性原理的思考方式和强悍的意志,他们应该是首先是基于某些原因(?)想到了用这样的模型结构,然后发现这样的结构无论是训练还是推理,要做好都有非常大的工程挑战,不过这些问题在他们工程团队来说并不是搞不定的,关键是花那么大力气做完是否有大的收益呢,在最终结果出来前,谁也说不准,他们还是赌了,结果是赌对了。也可能是反过来的,基于系统的出发点设计了这样一个全新的模型结构。”袁进辉称。
随后,尤洋发表“关于DeepSeek MaaS成本”和“坑人的硅基流动”两篇文章。
尤洋表示,DeepSeek数据对计算MaaS成本没有任何参考价值,文章中把DeepSeek网页,APP和MaaS API的token数加在一起计算。但尤洋认为,他说的MaaS,是ToB的工具,不是ChatGPT类的APP。DeepSeek的MaaS要想有一个这么高满负荷的状态,必须要让自己的APP和网页始终超负荷运转。他还指出,春节期间DeepSeek使用体验意识到“根本就不是一个合格的MaaS产品”。
“DeepSeek出圈前,2025年1月2日我就在微博上说过DeepSeek是中国最好的模型。我对DeepSeek没有任何贬低。但是,春节期间DeepSeek APP和网页的latency性能和使用体验简直是垃圾。”尤洋表示,卖DeepSeek MaaS不可能赚到钱。
对于硅基流动,尤洋发文称,硅基流动三周前网站访问量大增原因是牺牲员工的春节假期,绑上华为春节假期期间最早发出公众号和可用的DeepSeek API,由于华为在中国的地位,让人联想到AI全栈国产化,激起了国人的兴趣,宣传效果很好。同时,邀请码直接送代金券,“拉人头”在小红书上快速形成病毒式扩散。邀请人和被邀请人都能获得14元。有很多小红书用户刷到了上千元。
不过,尤洋指出,硅基流动称自己有300万用户,小红书很多用户说自己的代金券刷到了1000元。假定平均每个用户500元,这样硅基流动有15亿的代金券需要兑现,但是这家公司只有1-2亿的现金。风险很大。所以他们必须要阉割模型。他还称,硅基流动网站的访问量跟阿里云和火山云比较,这是不合理的,应该把硅基流动的访问量跟Kimi Chat或者秘塔搜索去比较是合适的。
“今天DeepSeek有一篇文章指向我,他(袁进辉)也在那里煽风点火。”尤洋表示,如今硅基流动已经限制这帮学生每天的调用量,而且API速度跟蜗牛一样慢。
而且,潞晨科技宣布将暂停DeepSeek API服务。“尊敬的用户,潞晨云将在一周后停止提供DeepSeek API服务,请尽快用完您的余额。如果没用完,我们全额退款。”
接下来,二人在朋友圈当中开始互怼。
袁进辉称尤洋诋毁公司,并直指潞晨科技代码有“抄袭行为”。
“我们团队愿意拼搏抓一个机会有什么错?邀请用户送点免费券有什么错?很多应用都这么做,海外也有;春节那几天,全民都想访问 DeepSeek而不得时,我们提供了仅有的一个稳定的服务,用户愿意过来有什么错?来的人太多了,网站被挤爆了,付费用户也用不了了, 只好辟出一块资源作 Pro版给付费用户,保障付费用户体验有什么错?我们免费版现在体验。硅基流动工程师在几年前 OneFlow时就开源过一批比英伟达官方实现还要快的算子,还被潞晨科技抄袭,只是为了给对方留个面子没有公开,现在竟然这样诋毁我们。”袁进辉表示。
尤洋指出,硅基流动代码都是(前)潞晨CTO负责的,抄袭代码事件后,潞晨CTO离职,加入了硅基流动。
据悉,硅基流动和潞晨科技都属于国内AI Infra算力公司,提供算力平台、AI Infra解决方案等,打造AI开发和部署平台。
其中,今年2月,潞晨科技完成新一轮融资,北京经济技术开发区产业升级股权投资基金参与本轮投资,该基金是亦庄国投政府投资引导基金体系的一部分。而潞晨科技上一次融资发生在2024年9月,完成了数亿元A++轮融资,北京市人工智能产业投资基金、石溪资本等参与投资。
硅基流动创始人、CEO 袁进辉
而硅基流动(SiliconFlow)公司则于2月底宣布已完成亿元Pre-A轮融资,华创资本领投,普华资本跟投,老股东耀途资本继续超额跟投。本轮融资之前,硅基流动已引入美团作为战略股东。此外,硅基流动大模型云服务平台SiliconCloud首发上线基于华为云昇腾云的满血版DeepSeek-R1&V3,引发关注,公司称SiliconCloud平台总用户数已超300万,日均调用上千亿Token。在此之前,袁进辉和美团联合创始人王慧文创立了“光年之外”公司,后被美团收购。
截至发稿前,尤洋对钛媒体AGI表示,“(该公司)一个抄袭的负责人CTO,离职后,直接加入袁进辉老师公司。第二个抄袭的负责人,潞晨云产品经理,直接被我们开除了。现在也加入了某友商。我就不提名字了,避免进一步引战。没办法,总被人做局。”
而钛媒体AGI也向袁进辉寻求进一步回应。袁进辉称,“(潞晨)CTO没加入我们公司,之前加入的是光年之外,后来加入其他大公司了。而且都是他自己犯错甩锅给别人,不是别人的问题。”
(本文首发于钛媒体App,作者|林志佳)