出品|虎嗅科技组
作者|宋思杭
编辑|苗正卿
头图|视觉中国
DeepSeek“开源周”正在掀起一场革命,但要不要革命,怎么革,取决于大模型厂商自身。
持续了五天的“开源周”本应该在2月28日画上句号。但3月1日,DeepSeek再次开源一个重磅代码库,推理效能极致提升,成本利润率达545%。这种效能提升在业界是前所未有的。
根据估算,目前业界H800的平均性能水平可以达到500~1000 tokens/s(输入)、250~350 tokens/s(输出);而DeepSeek的效率是73.7k/14.8k(输入/输出)。
如果把DeepSeek R1比作一道菜,那么一周内,其已经分别将这道菜所使用的原材料(指数据)、来源、具体加工流程、步骤,毫无保留地公布出来。
大模型开源社区生态平台OpenCSG(开放传神)创始人陈冉告诉虎嗅,“这是一套完整的‘生产线’。像这样的代码库开放是前所未有的。从没有任何一家将模型是怎么做出来的开源出来”。
相当于,DeepSeek先后甩出了两颗炸弹。第一颗炸弹是R1技术报告,因为里面提到了创新点;第二颗就是上周开源的代码库,也就是创新过程。
据虎嗅了解,更重磅的还是在开源周之前DeepSeek发布的NSA(Native Sparse Attention)。“R1是为了解决后训练和推理,但NSA解决的是预训练的成本问题。这种极致的降本增效方式,挑战了预训练Scaling Law的规则。”陈冉告诉虎嗅。
不过,虎嗅还向行业人士了解到,即使DeepSeek公布出这一整条大模型“生产线”,也未必有几家基座模型厂商能照模照样地生产出下一个DeepSeek。这一方面取决于其自身的开源基础,另一方面是适配难度。
更甚的是,DeepSeek引发的这场开源潮,掀起了国内所有大模型厂商的一场革命,有些甚至不惜成本革自己的命。
据虎嗅获悉,几家云厂商已经开始大刀阔斧地调整组织架构,内部也正在探讨新的商业模式;而大模型六小虎方面,普遍对内在筹备应对方案,对外拒绝对DeepSeek发表任何态度。
适配得了DeepSeek“生产线”的,凤毛麟角
首先,真正能将这条生产线适配到自身模型的,是有开源基础的基座模型厂商。但国内有多少这类厂商则要打一个问号。
开源基础是需要积累的。陈冉认为,“从开源积累到一定程度,才会有创新,有了一定的创新,才能叫有开源基础。”而即使有了开源基础,“能学到精髓的厂商,也只有凤毛麟角。”
同样,这场开源潮中,真正适合开源的并不多,剩余的即使开源,也只能是加速丛林法则,会更快地死掉。
某行业人士向虎嗅表示,六小虎里面,智谱和Minimax最有可能跟上,因为它们有开源基础,但模型能力还需要提升。而对于云厂商,他们即使开源也不可能做到DeepSeek这种高度,一方面是受商业化裹挟,另外他们开源的目的是为了卖云服务。
一个值得注意的问题是,在DeepSeek之前,国内有多少基座模型厂商发了paper?这点也足矣证明国内有开源基础的并不多。
能够预判的是,DeepSeek开源周之后,漏斗很快会形成。
另一个更大的问题是,如果基座模型厂商按照开源周的代码库,优化自身代码,是否能成功适配也是很大的问题。
“这与基座模型厂商的运营策略、模型自身特点、商业模式都有很大关系。”陈冉告诉虎嗅。
如果重写代码,或盲目开源,可能会彻底颠覆掉自身的模式。这种革命对云厂商来说都是一场大换血,对六小虎来说则会走向覆灭。
所以接下来,基座模型厂商是否真的会优化自身代码,或者说如何优化,也是一大疑问。
开源也可能加速死亡?
如何判断一个大模型是否在盲目开源?
在陈冉看来,模型之所以会开源,是因为公司想继续提升核心技术,并且通过大量的用户反馈,帮助找到其自身的商业模式,最终目的是收集用户通点。
但常垒资本合伙管理人冯博对虎嗅表示,之所以集体开源,确实并非都有必要,而是现在来看,闭源已经没有意义了。“除非未来国内有闭源模型超过DeepSeek,或有独特的垂直领域特长。”
据虎嗅获悉,部分未能成功抢投大模型六小虎的机构们,现在都认为当初错失机会,如今看来也是塞翁失马。
对六小虎来说,如果盲目开源是来自内部的危机,那来自外部的危机则是因为DeepSeek的爆火,大量DeepSeek一体机的出现也同样会对六小虎造成生存威胁。
冯博认为,“如果六小虎的模型未来依旧难以媲美DeepSeek,那么他们很有可能都打不过蜂拥而至的一体机厂商们。”
然而,还有一种情况是,国产芯片与DeepSeek的适配效果可能并不理想。
毕竟,从DeepSeek开源周公开的代码库来看,其还是天然适配英伟达的CUDA框架。对此陈冉表示,“未来如果国产芯片无法设计出类似框架,那么DeepSeek与国产芯片到底适配得如何,是个疑问。”
有一点可以肯定,DeepSeek的确加速了国内的开源生态。无论市场会迎来一场怎样的洗牌,结局都已经写好了。未知的是,谁会留下,谁会消亡。