DeepSeek时刻

2025年1月27日,一家杭州的人工智能大模型公司DeepSeek(深度求索),凭借发布仅一周的开源推理大模型DeepSeek-R1,在苹果AppStore中国区和美国区的免费榜上双双赢得第一,OpenAI的ChatGPT、Google的Gemini等产品都在其后。

这是DeepSeek继2024年12月26日发布DeepSeek V3后,再次惊艳AI世界。

这两个产品证明,在AI这一美国资本最看重的战略竞争领域,中国正在走出自己的路。美国有ChatGPT时刻,中国也在很短时间有了“DeepSeek时刻”。

和ChatGPT的“三高”特征——高端芯片集群、高额训练投入、高额算力供给相比,DeepSeek的最大特征是训练成本大大降低,而性能依然优异。这和中国制造走向世界的“必杀技”——超高性价比,如出一辙。

特别值得关注的是,DeepSeek的发展,不是短平快地复制Meta的开源模型Llama,而是在架构设计、算法优化上做了很多创新,从而极大提升了推理的效率,减少了对资源的消耗。

例如,它提出了全新的MLA机制(多头潜在注意力),与传统的MHA机制(多头注意力)相比,把显存占用降到只是原来的5%~13%。具体来说,MLA机制通过引入潜在化的概念,在处理输入信息时先做一定的预处理,对信息进行选择性压缩和简化,从而在生成查询(Query)、键(Key)和值(Value)时显著减少了参数数量,降低了计算复杂度。

DeepSeek所代表的创新,已经成为全球AI界的现象级事件。

位于旧金山的AI创新企业Perplexity CEO斯里尼瓦斯说:“他们(DeepSeek)以更高效、更低成本的方式开发了类似(Anthropic和OpenAI)的技术。这确实让人感到压力。”

前谷歌CEO埃里克·施密特和MakerMaker.AI公司CEO达瓦尔·阿乔达撰文指出:“DeepSeek能够以远少于美国科技巨头的资源与其竞争,这给美国大厂带来了巨大压力。美国针对中国的出口管制政策旨在切断其获得最先进计算芯片的渠道,以遏制中国在AI领域的发展。然而,事实可能恰恰相反——芯片短缺反而迫使中国企业提高计算效率,并探索降低训练成本的新方法。”


DeepSeek是怎样一群人做出来的?

DeepSeek脱颖而出后,美国Anthropic联合创始人杰克·克拉克说,DeepSeek雇用了“一批高深莫测的奇才”。

2024年在接受36氪采访时,DeepSeek创始人梁文锋就此回应说:“并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人,没有海外回来的人,都是本土的。”

MLA机制的创新,最早来自一个年轻研究员的idea,“在总结出注意力架构的一些主流变迁规律后,他突发奇想去设计了一个替代方案,之后从想法到落地,一个团队花了几个月时间跑通了。”

好一个“突发奇想”!今天中国最缺的可能就是不亦步亦趋的突发奇想,并为突发奇想者创造充分发挥其潜能的环境。

梁文锋说,在Open AI发布的时候,中国普遍对前沿的科技创新缺乏信心,从投资人到大科技,都觉得差距太大了,应该像以往一样,等着摩尔定律从天上掉下来,在家里躺18个月等更好的硬件和软件出现。

而DeepSeek的价值态度和选择是——

“随着经济的发展,中国应该成为贡献者,而不是搭便车的人,去参与真正的技术创新。”

“过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。”

“以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。”

DeepSeek写在官网上的口号是:探索未至之境/Into the unknown。因为它的轰动,中国商界和社会有可能发生一些变化:更追求前沿科技而不是拷贝科技,更看重硬核科技而不是酱香科技,更推崇创新大神而不是老板大亨,更热爱探索未知而不是守成求稳。


在我看来,如果这些变化能成为现实,让整个社会都深度求索起来,求索真知,探索未知,才是DeepSeek的最大影响所在。

硬科技与硬精神

中国的硬核创新并非始自DeepSeek,但任何硬核创新都需要深度求索的精神。

春节前,我在上海张江的高质量孵化器和中科创星创始合伙人、“硬科技”概念提出者米磊交流。他说:“中国的一个问题还是很多人的心态没过关,觉得我们跟美国没法比,觉得差距特别大,追不上。实际上不是这样。投对了资源,投对了人,就能追上,甚至超越。从量子计算突破边界、商业航天扶摇九天,到《黑神话:悟空》,再到DeepSeek,都证明了这一点。”

1月26日深夜,《黑神话:悟空》制作人、游戏科学创始人冯骥通过微博盛赞DeepSeek。他说:“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

其实,《黑神话:悟空》的团队也是一个非常本土的团队,最初只有十几个人。去年在比亚迪第1000万辆新能源汽车下线庆典上,我和冯骥邻座,问他最重要的成功因素是什么,他说第一就是在2018年下决心做一个中国题材的大型3A级单机游戏(注:3A指高投入、高制作、开发周期长,A lot of money、A lot of resources、A lot of time),第二是保证高品质。

“从现在看,如果当初我们选择做‘悟空’时,还有别的团队也做中国题材的3A游戏,也可能会取得成功。只是过去大家都不敢想。现在,是一个时代到了。”冯骥说。


按我的理解,冯骥所说的“时代到了”,除了是指游戏用户市场的规模、游戏产业软硬件技术的飞跃外,也是指中国因素、中国题材已是产品走向世界的红利,而不是拖累。从中国新三样、智能化科技生活产品、泡泡玛特等在海外的畅销,到中国网游网文网剧和众多互联网应用在海外的走红,在在处处也都是证明。

当然,要建立全球影响力,光有中国题材是不够的,还要做成一流精品。

为做好《黑神话:悟空》,从形象、画面、音乐到文字字体,冯骥团队如履薄冰,精益求精。每个游戏人物的名字都是欧阳询楷书字体,源自欧阳询的碑刻和拓本,有31个角色可以在1986版电视剧《西游记》里找到原型,部分角色还用了电视剧的演员配音。公司自建的扫描团队用了三四年时间在全国100多个地方扫描古建筑和不同的地貌,并在游戏中用合理方式呈现出很多实景和实物,也让这部作品在发行后很快出圈,形成了虚拟世界和文旅世界的互动。

游戏科学公司官网上,关于“游戏科学名字的由来”,冯骥这样诠释:

“在创建游戏科学这家公司之前,我们感觉游戏行业在国内似乎远远算不上一门科学(类比通信行业或者计算机行业),而是充斥着由当前成功产品反推的,形形色色的成功学。

“为什么叫游戏科学?因为游戏也和其他行业一样,是一门99%勤奋+1%灵感的严谨学科,而不是一桩跟风押注的赌徒生意。”

从梁文锋所说的“这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展”,到冯骥坚持的绝不做“跟风押注的赌徒生意”,我们看到了和资产负债表疯狂扩张那个年代所迥异的态度与追求。

硬核创新的竞争,从根本上说,在于前沿技术。

在张江高质量孵化器展厅,我看到了光量子计算原型机“九章三号”的模型。量子计算是后摩尔时代的一种新计算范式,在原理上具有超快的并行计算能力。2023年,中科院量子信息与量子科技创新研究院团队与中科院上海微系统所、国家并行计算机工程技术研究中心合作,成功构建了255个光子的“九章三号”,其在百万分之一秒时间内所处理的最高复杂度的样本,需要当前最强的超级计算机“前沿”(Frontier)花费超过200亿年时间。

这表明,光量子技术原型机在某些特定的复杂问题求解上,具备经典计算机难以企及的强大算力。

虽然要做出真正实用化的量子计算机,还要解决很多核心技术难题,但“九章三号”又一次刷新量子计算优越性的世界纪录说明,在前沿科技的探索上,中国不是只能当跟随者,而有希望成为引领者。

米磊说,中国过去的发展路径,很大程度上是沿着“国外蹚路、国内跟随”的模式,不用承担探索方向出错的浪费,获得的是确定性的中低收益。未来则必须向硬科技进军。

“典型的硬科技有两种,一种是当下中国卡脖子的关键核心技术,一种是未来能够引领新一轮科技变革的颠覆性技术。”

“如果芯片的尺寸从几百纳米到几纳米,这属于延续性创新,但如果能够做出架构完全不同的量子芯片或光子芯片,这就是颠覆性创新。”

硬科技时代,需要硬科技精神。米磊说,硬精神有几个内涵:一是勇担使命,二是敢为人先,三是啃硬骨头,四是十年磨剑。

梁文锋说,对顶级人才吸引最大的,肯定是去解决世界上最难的问题。“其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。中国产业结构的调整,会更依赖硬核技术的创新。很多人发现过去赚快钱很可能来自时代运气,现在赚不到了,就会更愿意俯身去做真正的创新。”

一个时代的商业精神正在嬗变,它跟随这个时代的国家战略目标而变。


中国制造,硬核创新的代表

DeepSeek时刻是当下最热的AI事件,AI又是中美博弈最具话题性的看点,自然成为本文的主题。

但我认为,中国的硬核创新之本,还是在制造业,在大国重器,在专精特新,在一批具备世界级竞争力的技术创新企业的崛起。

为什么?最简单的理由是,过去这几十年,不少发达国家将制造业外包了,“放逐”了,而中国好像命里注定就是干制造业的,硬生生干成了包罗万象的世界工厂,一刻也没停过。不是十年磨一剑,二十年磨一剑,是四十多年磨一剑,想一想,就算一开始是再粗糙不堪的锈铁,最终能磨成什么样的锋刃?!

对制造业的长期观察,让我越来越将制造业理解为人类在物质材料上实现的知识进化和能力进化,包括物理、化学、生物、运算、信息等各种知识,也包括生产、组织、运营、创新等各种能力。知识和能力的进化需要一种现实载体,以接受使用者的检验、反馈、改进、超越,再检验、再反馈、再改进、再超越。制造业就扮演了这样的角色。

因之,守住制造业,实际是守住了知识和能力进化的根,放弃制造业也就放弃了一种重要的进化与创新方式。

最近20年,美国已有很多学者指出,创新是要以产品开发和制造过程中形成的知识和经验体系为基础的,创新与制造业密不可分。的确,在大多数情况下,最赚钱的不在制造业,比如美国最赚钱的公司是苹果公司,它在美国设计产品,在全球分销产品,但并不制造,制造基本在中国完成。在中国社交媒体上也一直有一种说法,即果链企业所获的利润占比太少。

而美国学者在调研中的发现则是,苹果的高级设计师、研究人员有超过一半的时间待在中国的工厂里,帮助果链企业把东西造好。可见物品的制造并不简单,中间要投注、消化很多的要求,这些要求的背后就是一代代不断提高的知识参数与能力标准,沉淀在材料、工艺、设备、检验的各个环节,以及关于产品功能的定义,和对这些定义的可靠稳定的实现之中。

在这个过程里,美国公司赚到了能赚的钱,中国企业获得了能得的能力。两不亏欠。关键看未来。美国要看能不能用钱赚更大的未来,中国要看能不能用能力赚更大的未来。

也许是命中注定,也许是情有独钟,如果历史重来一次,我猜中国大概率还是会选提升能力这条路。技不压身。攒能力比攒钱更重要。

今天我有一个感觉,无论走到哪里,经常可以看到中国制造的种种奇迹,让我明白,时间就是能力进化的最好朋友。

去年底我到广东南海狮山镇,在一家混合所有制企业中海万泰看到专为深地、深海油气开发量身打造的高端油气装备,名叫“璇玑”,它可以在几千米地下瞄准油层钻探,控制钻头在0.7米的薄油层中,横向或斜向稳定穿行数千米,并对地层资料进行实时分析。


|中海万泰制造的“璇玑”

而以前在海上进行石油开采,要先测算一个半径约10公里的范围进行钻井,一旦定位不准就要移动钻井位,移动一次的费用要上千万元。有了“璇玑”,油气田的开发成本大大降低。

看起来是制造,其实是知识和技术。“璇玑”技术就是旋转导向钻井与随钻测井技术,被誉为石油钻井技术“皇冠上的明珠”,横跨20多个学科、涉及1000多道高端工艺,有多达几百万行控制代码。

2008年,中国海油确立了自主研发的技术路线,7年攻关,成功研发出了“璇玑”系统。之后为更好地推动产业化,中国海油旗下的中海油服和佛山一家专注高端精密机械研发与制造的民企“中南机械”强强联合,成立了中海万泰,投入了超过200台定制型数控加工设备,先后突破了多个特种材料加工应用难题以及枪钻细深孔加工、高精度深孔电火花等技术难点,实现了“璇玑”全系零件的自主加工。

我在车间里看到了枪钻工具。要在高温高强度特种合金里埋上电线,就要用这根刀杆,打穿一个细长孔,孔径只有2毫米到8毫米,长度最长可达6米。从2022年起,中海万泰总经理许冠和工程师、技师们持续钻研近两年,终于彻底捅破了这层“窗户纸”。

今天在中国,像这样默默无闻却内蓄着硬核创新的案例,用雨后春笋来形容毫不为过。作为一个观察者,我的遗憾就是看不完,写不尽。

这就是一步步发展到今天的中国制造,充满了知识、能力、技术的艰辛创造与创新突破。在某种意义上,中国供应链,就是中国的科技创新链。

即使中国最优秀的那些制造企业,也不可能赢得DeepSeek的轰动,但在我内心,它们更是硬核创新的代表,是真正的英雄。

我也希望,中国的AI大模型能够帮助它们,在智能化方向上更进一步。

结语

从我接触的大量优秀企业中,发现都有那么几个关键时刻,构成了它们的“成人礼”。

这些时刻基本上都是下定决心,挑战技术难题,去做以前不敢想、不敢投,觉得自己做不了、做不成、风险太大的事。

真的做了,过了这一关,整个心态就会改变,就会真正建立起自信,否则就永远觉得,逾越不了国际上的某某标杆。

这并不是说,对外开放、对外学习、对外合作不重要,事实上,整个中国产业能力的变迁,与开放是分不开的。前一段,一家民营钢铁企业的总经理向我回忆了上世纪80年代上海宝钢引进日本先进技术和设备的建设过程中,冶金部让全国的钢铁企业都到现场学习,极大提高了整个中国钢铁工业的水平。

我也听不少中国企业讲到,虽然自己已经收购了当年想收购自己的国外同行,但当初从这些“洋老师”身上获益匪浅。

即使今天,DeepSeek的创新,也是站在美国生成式AI和Meta开源模型的基础上展开的。作为中国最重要硬核创新代表之一的“大飞机”,也在强调统一战线的重要性,强调需要广泛团结、凝聚国内外各方力量,共谋发展,共赢未来。

对外开放绝不应该是一种权宜之计。也没有谁真的能够包打天下。

但是,总想着躺在别人怀里实现创新,那注定不会有什么大出息。今天,中国企业已经有了比过去好得多的条件,迎难而上,克难攻坚,展开方方面面的硬核创新。

2000年中国的研发经费为896亿元,2001年超过1000亿元,2012年超过1万亿元,2019年超过2万亿元,2022年超过3万亿元,2024年超过3.6万亿元。过去1/4个世纪,中国在研发方面的复合增速远超GDP增速。创新研发的后劲正在爆发。

去年我提出,未来中国经济有两大战略机遇,一是从世界的工厂、工地到世界的市场和创新场,二是走出去,实现中国能力的全球化,再造一个“经济中国”。从DeepSeek时刻到中国制造的脱胎换骨,大致可以下一个判断,即中国的硬核创新时代已经来临,中国成为世界的创新场并非虚幻,已在不可抑制地强力启动。

如此再脚踏实地,专心专精,干上十年二十年,则中国巍然屹立于世界科技创新之林,当不容动摇。


No.6187 原创首发文章|作者 秦朔

开白名单 duanyu_H|投稿 tougao99999|图片 视觉中国/豆包

ad1 webp
ad2 webp
ad1 webp
ad2 webp