头图由豆包生成,提示词:人工智能 大脑
近期,不仅DeepSeek走红,德银的一份报告也火出了圈——德银分析师马克·安德里森(Marc Andreessen)将DeepSeek的发布称为“中国的斯普特尼克时刻”(Sputnik moment),标志着中国AI科技的崛起。
“斯普特尼克时刻”是指某一国家或地区在某个领域的突然突破,带来巨大的技术、经济或政治影响,通常促使全球或其他国家重新评估自己的发展方向和竞争力。这个词源于1957年苏联发射的第一颗人造卫星——斯普特尼克1号(Sputnik 1),它标志着苏联在太空竞赛中的突破,震惊了全世界,尤其是美国。
安德里森提及,中国最初在全球范围内确立企业主导地位的是服装、纺织和玩具行业,随后在基础电子产品、钢铁、造船等领域占据优势,近年来又主导了家电、太阳能等行业。
直到2024年底,中国凭借电动车出口的惊人增长,引发全球关注。而在 2025年,中国在一周内接连推出全球首款第六代战斗机和低成本AI系统 DeepSeek,再次震撼全球市场。
中国在高附加值领域的领先地位正以前所未有的速度扩展。
据报道,DeepSeek每生成100万个token仅收取1.4美分,大约相当于70万个单词。相比之下,Meta对其最大模型的相同输出收取2.8美元,其收费相当于是美国大模型的1/200!而成本仅仅是Open AI的1/50左右。
当然这几天市场有争议,DeepSeek的技术是否真的已经领先美国,成本是否真的那么低,这些还有待时间去考证。但是至少说明一点,中国的AI发展比市场预期得要好,并没有落后美国那么多。
如今,更关键的问题在于,究竟中美AI浪潮未来将如何演进?如何看待所谓的“蒸馏”(distillation)质疑和开闭源争议?模型平价化趋势的深入将带来什么结果?
英伟达的抛售也引发了另一个思考——算力需求显著下降,未来究竟是会导致算力消耗量下降,还是说训练模型的玩家随着门槛的降低而增加,且推理市场打开后,可能对算力需求量上升?
随着AI主题可能会从基础设施层转向应用层 ,To C场景还有什么变现手段?如果不靠模型盈利,To C市场会有哪些?
DeepSeek加速模型平价化进程
OpenAI的诞生使AI彻底迎来觉醒时刻。回顾2024年,美国“科技七巨头”市值增长了6万亿美元,AI主题是主要推动力。
英伟达以及“超大规模”企业(hyperscaler,例如微软、谷歌、Meta、亚马逊)贡献标普500指数总回报(25%)的41%。
然而,也就在春节前夕,DeepSeek R1、字节跳动的豆包1.5 Pro,以及月之暗面的Kimi k1.5模型相继推出,引发了全球投资者的高度关注。
DeepSeek的优异表现以及不及OpenAI近1/20的算力成本令英伟达股价一夜暴跌17%。截至1月26日,DeepSeek在美区苹果App Store免费榜升至第六位,超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品,而后一度冲至第一。
或许这也意味着,在未来AI竞赛中,中国不一定会落后,中国可以用更少的GPU构建模型。但核心原因在于,AI的关键并不在于构建最佳模型,而是在于模型的应用与采纳。
一个社会的繁荣程度并不取决于拥有最佳模型,而是取决于其如何高效地采用AI技术。
值得一提的是,推理大模型DeepSeek-R1以开源形式问世,性能比肩OpenAl的闭源旗舰模型o1,但训练成本仅为后者的1/20。这一突破让硅谷陷入焦虑,更暴露了Al领域长期依赖硬件堆砌与封闭生态的脆弱性。
早在去年三季度,高盛就发布多份报告,预警AI开支太大的风险,其中一份名为《生成式AI:太多支出,太少收益?》(《Gen AI:Too much spend, too little benefit》)。然而华尔街似乎并不在意,投资者继续追捧着“AI资本支出越多、股价越应该涨”的故事。
到目前为止,市场既奖励了在AI上大举投入的公司(如亚马逊、微软、谷歌、OpenAI等),也奖励了提供工具和基础设施的公司(如英伟达、博通、Vertiv,以及广泛的半导体行业)。
然而,DeepSeek模型具有低成本特点,一度动摇投资者对整个AI生态系统的信心。
数据显示,谷歌、Meta、亚马逊、微软、苹果和甲骨文的资本支出总额,一直在大幅增长。2023年支出总额高达约1600亿美元,2024年的资本支出将大幅增长,从大约1600亿美元增加到2000亿美元。
例如,微软预计今年将在资本支出上花费800亿美元,基本与微软全年的现金流持平,即便大模型的潜在市场较大,但市场投资者看到这个数字后,不免有一些动摇。
根据Brad Gerstner提到的数据,Meta和微软的资本支出已经超过了其收入的25%。苹果和亚马逊则处于中间位置,资本支出约占收入的10%~15%。
资本支出是否能够继续且是否必要尚无结论,但模型平价化的时代必然将加速到来。未来模型、研究将进一步商品化。但平价化趋势并不是负面的——早在2023年推出OpenAI大模型时,它在世界中拥有超过50%的市场份额,今年它大约有36%,已经失去一些市场份额,但这并不重要,整体的蛋糕变大了。
不难发现,市场竞争是降低成本、推动平价的关键方式,这样会使得更多人使用这个技术,把蛋糕做大,集体繁荣的实现前提是,确保关键资源不会被少数人控制来推动。
DeepSeek这一更高效且成本更低的模型的出现,无疑加速了这一进程。
与此同时,DeepSeek也引发了争议。有媒体报道,OpenAI早前表明,已经掌握证据,显示DeepSeek在训练模型时通过“蒸馏”(distillation)使用OpenAI的数据,违反服务条款。
不过,OpenAI首席执行官Sam Altman对媒体表示,“没有计划起诉DeepSeek”。他表明,DeepSeek-R1的确令人振奋,但他相信OpenAI会继续开拓前沿领域,提供优秀的产品,“我们很高兴又迎来一位竞争对手”。
但事实上,即使DeepSeek可能违反OpenAI的API政策,从科学角度来看,全球尚没有针对模型蒸馏的明确规则。虽然蒸馏技术可能涉及知识产权问题,但在科学研究和开源领域中,让技术能够快速发展才是最重要的。
算力需求仍将增加
DeepSeek的出现也让英伟达站到了风口浪尖,引发了各界对大模型价格战和算力需求下降的担忧。1月末以来,华尔街基金经理的心情好似英伟达股价那般坐上过山车。
1月28日,英伟达暴跌17%,从142美元跌至118美元,市值跌去了一个阿里巴巴。如今,英伟达股价在128美元附近。
但在业内人士看来,如果投资英伟达的理由是相信AI需要大量的芯片基础设施,从而来持续训练大型语言模型,那么这种投资逻辑是不正确的;
如果投资的理由是看好AI成本的下降以及对GPU需求的持续增长,那么这个逻辑其实是成立的。
一位行业资深人士也对笔者表示,GPU就像是AI的“大脑”,届时我们可能需要数万亿个GPU,因为它们比人脑便宜得多。虽然AI变得越来越便宜,但更重要的是其变得越来越强大,因此对计算能力的需求将继续大幅增加。
这就好比杰文斯悖论(Jevons Paradox)所强调的,一项资源如果变得更高效,那么对这项资源的需求其实是将更大的。同时,市场竞争是降低成本、推动平价的关键方式。
举一个例子,在50年前,如果告诉某人美国电力的成本将如今天这么低,他们会质疑能源公司如何盈利。但事实上,电力变得便宜后,几乎一切都需要电力驱动;同理,互联网的普及使得每个人都能接入,虽然价格低廉,但公司通过提供普遍可用的服务获得盈利。
平价模型如何盈利?
随之而来的另一个问题在于,随着模型越来越平价、玩家越来越多且越来越卷,如何打造可以盈利的商业模式?
我们可以通过这一片段来进行思考。面对DeepSeek,Sam Altman此前发推表示,“复制容易,创新很难”。
尽管这看似有其逻辑,但历史上投资者往往过于重视原创创新者的价值,低估了竞争的影响,并高估了早期创新者的资本回报。
同时,新的进入者常常受益于他人的资本支出,从而能够推出新的产品和服务。
回顾历史,科学研究并不是特别难以复制,而且这种复制有助于推动技术的普及和平价化。历史上的几位著名人物,如居里夫人、本杰明·富兰克林等,他们并没有因为自己的科学发现而赚钱。
科学发现应当是全人类的财富,真正应当赚钱的地方是“分配”(distribution),换言之是如何将技术触达各大市场。
OpenAI的成功也在于此,“何人都可以复制OpenAI”的说法并不正确。OpenAI不仅仅依靠研究成功,还依赖于强大的品牌建设和市场渠道,这些要素很难被复制,这可能是未来模型平价化之后需要考虑的事情,即如何打造属于自己的护城河?
就国内的大模型来看,降价比例较大,从价格角度,大厂可能会持续往这条路走,一方面迫于竞争压力,一方面本身有成本优化方式来使成本降低。所以整个市场上,不要看单独靠模型盈利多少。
在业内专家看来,在模型调用方面,无论是十亿还是数十亿、万亿级token,未来只是收入之一,整体还是希望通过低价牵引行业快速商业化。
虽然部分公司B端用户量从翻了几倍,到了几十万量级,但模型调用次数还不那么高,基于现在模型还不够好、生成速度慢、生成质量不高,另外价格也是一部分原因,所以未来通过低价方式,一是应对竞争,二是把B端客户迅速融入自家生态、快速业务上线、推送到B端或者C端客户手上用起来,只有用起来后,大厂未来才有可能赚到钱。
具体而言,在大厂盈利逻辑不靠模型的假设之上,盈利方式可能有几种——如果To B端,要做捆绑式销售,模型本身成本较低,但客户用时要选很多其他东西、周边产品,例如数据库、算力、插件,搜索、BI、PaaS、SaaS等,这些依然保持较高利润率。通过低利润模型调用加上高利润率产品绑在一起,把利润率做高。
在To C赛道中,核心变现逻辑是通过精准信息匹配、用户上瘾机制提升付费意愿,实现商业价值最大化。
主要的变现策略也有几种:例如,通过提供AI生成工具支持UGC创作,并设定不同的使用级;免费用户可以每天生成一定数量的低分辨率内容,超出部分收费。未来社交平台上的AI生成内容将越来越多,AI生成工具可以通过订阅或按次付费模式变现。
此外,电商导流变现也可预见。通过AI入口重新塑造电商流量格局,从传统的短视频平台(如 TikTok、抖音)搜索产品,转向AI入口(如字节旗下的豆包)搜索商品。通过AI搜索技术(文本搜索、多模态搜索)进行精准商品推荐,同时插入广告,实现商业化。
AI硬件与订阅服务也是一种变现渠道。AI硬件(如智能耳机、智能音箱)作为AI应用的延展,用户可直接购买硬件,形成收入来源。
智能体(AI agent)是今年的大热词,未来智能体的个性化服务也是To C端的变现渠道,如定制AI角色(数字网红、虚拟偶像),提供付费订阅、充值、虚拟礼物等增值服务,使用户产生依赖性,从而增强变现能力。
相比之下,目前Deepseek产品比较单一,仅是一个模型,尽管价格低,但在和大厂竞争时,并没有产品矩阵概念。此外,Deepseek仍只是一个文本模型,随着技术发展,可以缩小文本模型和海外的差距,但是这种技术很难复制到其他模态,如音频、图像、视频等都是新模型架构,业内各界也在研究哪些可以沿用到其他模型。
整体而言,各界不应该盯着模型的价格战,而是要看这个方向有没有衍生出更多应用。只有应用落地,被广泛B端、C端用起来后,整个市场才真正活跃起来,否则模型只能停留在自己平台上自用,没有生态在赋能,商业化也会受阻。
No.6203 原创首发文章|作者 周艾琳
开白名单 duanyu_H|投稿 tougao99999|图片 视觉中国/豆包