新智元报道
编辑:编辑部 HYZ
【新智元导读】巨头英伟达,即将收购阿里前副总裁贾扬清的初创Lepton AI,交易价值或达数亿美元!而Lepton AI,仅仅创立两年。
就在刚刚,国内AI圈被这一消息刷屏了。
贾扬清成立两年的AI初创公司Lepton AI,即将被英伟达收购。
据外媒The Information报道,英伟达正在接近达成收购Lepton AI的协议,交易金额为数亿美元。
而Lepton AI的主要业务,就是专门出租由英伟达AI芯片驱动的服务器。
根据贾扬清介绍,在SemiAnalysis评选的neolcould解决方案中,Lepton AI是唯一一个没有重金采购GPU的公司。
因为他们采用的是云原生的多云解决方案,能让任何一家GPU提供商迅速升级。
为什么英伟达选择在此时重金收购Lepton AI?
原因是,亚马逊和谷歌这些老客户步步紧逼,英伟达被逼得实在没有办法了,不得不立刻转型!
老客户背刺,英伟达被迫转型
本来,亚马逊和谷歌都是英伟达的最大客户,但现在,它们纷纷通过开发、低价租赁替代芯片,来降低对英伟达的依赖。
这样导致的结果,就是英伟达的收入大幅减少。
而收购Lepton AI,是英伟达进军云计算和企业软件市场战略布局的一部分,目的就是为了和亚马逊、谷歌开战。
Lepton AI的总部位于加州,在租赁英伟达GPU服务器业务上,它和Together AI之类的初创公司是直接竞品。
注意,这些公司并不会自行管理数据中心或服务器,而是先从云服务提供商租用服务器,再租给自己的客户。
这个业务,利润空间就很大了。
据悉,Together AI如今已经实现了超过1.5亿美元的年化收入,换算一下,就是大概1250万美元的月收入。
这类企业,在业内被称为「推理服务提供商」或「GPU转售商」。
另外,他们的业务除了硬件租赁,还包括开发自己的软件平台,帮助其他初创公司或软件企业这类客户在云环境中构建和管理自己的生成式AI应用。
不过跟Together相比,Lepton AI的收入规模就没有那么大了。
他们AI云服务的主要客户,有游戏初创公司Latitude.io和科研初创公司SciSpace。前者使用使用Lepton AI来运行AI模型,支持一项月活用户已达数十万的服务。后者使用Lepton AI为学术论文搜索引擎提供技术支持。
总之外媒称,跟Together、Firewoks这些竞争对手相比,Lepton AI在市场上的形象总体比较低调。
被英伟达高价收购的Letpon AI,是何背景?
2023年7月,贾扬清离职阿里4个月后,新公司Letpon AI正式浮出水面。
这是一家专注于人工智能基础设施的公司,总部位于美国加利福尼亚州Palo Alto。Lepton AI这个名称源自物理学中的一种基本粒子——轻子。
公司曾于23年5月成立之前,完成了首轮1100万美元天使融资,由Fusion Fund、CRV领投。
当时,贾扬清在回复Pytorch之父评论中,曾提到还有两位联创与其一起创办了新公司,分别是ONNX创始人以及etcd的创始人。
此前,贾扬清最初在谷歌大脑担任研究科学家,还参与构建了部分支持Kubernetes的软件,Kubernetes是一个起源于谷歌的大规模云应用程序管理工具。
2016年,他加入Meta担任AI研究员后,又与白俊杰一起参与了PyTorch的开发。
Letpon AI的核心定位是,成为「AI时代云服务提供商」,旨在建立高效的AI应用平台。
其主要业务通过提供大模型推理引擎和云GPU解决方案,帮助企业去快速部署AI应用。而且,他们还建立了多云平台,整合全球GPU资源,让用户获得极具性价最高计算资源。
而且,团队还开发了一款智能搜索引擎Lepton Search,仅用500行Python代码构建,以轻量级、高效著称。
英伟达之困:光靠卖GPU,已经不够了
为什么英伟达要收购Lepton AI?显然,这是计划的一部分。
英伟达,如今显而易见正在构建全新的业务版图。
虽然它的云计算和软件业务目前尚处于起步阶段,但它已经开始向企业出租由自家芯片驱动的服务器,同时还会提供软件,帮企业开发AI模型和应用,以及管理用于训练AI的GPU集群。
根据英伟达的估计,这些业务未来有望创造高达1500亿美元的收入。
GTC大会上,老黄宣布:英伟达正在构建3个AI基础设施——云上AI基础设施,企业AI基础设施和机器人AI基础设施
不过有些微妙的是,在本月中最近一次季度财报电话会议上,英伟达却完全回避了这一话题。
三个月前,英伟达靠软件、服务和支持业务,已经实现了15亿美元的年化收入(每月约1.25亿美元),而英伟达预计,这一数字将在2024年底前攀升至20亿美元。
而英伟达的芯片业务,在截至1月26日的财季中创造的收入为356亿美元。
总之,虽然AI芯片仍然是英伟达的核心收入来源,但显然,软件、服务和支持业务的增长潜力巨大,英伟达已经下定决心,瓜分这一块蛋糕。
英伟达2025财年第四季度财报显示,公司发展一片大好,市场对AI芯片的需求依旧强劲
英伟达,大力发展工业客户
符合这一步调的是,英伟达最近几个月一直在大力宣传自家的软件产品。
虽然过去几年中,英伟达大概一半的AI服务器芯片,都是被云服务提供商买走了,不过老黄表示——
长期来看,英伟达对其他类型企业的销售额占比,将远远大于对云服务提供商的销售额。
他还暗示道,包括汽车制造商在内的工业企业,未来会直接购买AI芯片,而不是从云服务商那里租用。
此前大家对AI芯片的批评,主要就集中在价格昂贵、需求旺盛,让企业想扩展AI应用规模时,面临成本上的巨大压力。
但最近,DeepSeek这种价格亲民的强大模型,已经让局面彻底改变了。
而这几年,英伟达也在一刻不停地收购小型生成式AI和云计算初创公司,为的就是降低成本,让开发者能轻松使用英伟达芯片。
过去一年,英伟达就斥巨资收购了Run.ai和Deci,代价或许超过10亿美元。而最近收购的则是OctoAI和Gretel。
英伟达一直在收购小型生成式AI和云计算初创公司,以降低成本并使开发者更容易使用其芯片运行AI模型
GPU云服务评级,贾扬清初创进第二梯队
SemiAnalysis最新文章中,发布了世界上首个GPU云服务评级系统ClusterMAX™。
这个系统主要以普通用户的角度对GPU进行评,共分为5个不同等级:白金、黄金、白银、青铜和不及格。
目前,他们已独立测试了数十种GPU。
白金代表着引领行业标准的GPU云服务,目前也仅有一家CoreWeave达到这一级别。而在超大规模云服务提供商中,Oracle的GPU租赁价格是最低的之一。
评测结果还显示,一些青铜提供商,已经在努力赶上如谷歌云。谷歌云也在快速发展,有望下次冲进黄金/白金。
值得一提的是,Lepton AI这家仅成立2年的公司,成功进入第二梯队(黄金)。
Lepton AI,具体是干什么的
Lepton AI本身不拥有GPU硬件,而是专注于提供一个ML平台软件层,用于管理和优化GPU资源。
不论是初创公司,还是个人开发者, Lepton AI宣称皆能赋予专业级算力支持。
他们提供了两种灵活的使用方式,具体来说:
· 租用GPU:Lepton AI会从其他供应商租用GPU,在叠加上自家软件层,每GPU小时仅需额外之父几分钱。
· 自选GPU:从价格更优的Nebius租用GPU,然后单独购买Lepton AI软件和服务,同样是每GPU小时几分钱,即可享受完整的平台功能。
他们将谷歌、Meta等科技巨头在机器学习平台上的经验「平民化」,让普通用户也能轻松上手。
这种灵活性,能够让用户根据预算和需求自行选择。Lepton AI工程团队凭借着敏锐的产品洞察力,确保了平台高效性。
针对训练,他们提供了一种类似Slurm的作业提交方法。
在SemiAnalysis测试中,将现有的sbatch脚本正常运行在Lepton AI平台上,仅需几分钟的时间。而且,转换到平台进行训练的过程相当直观。
不过,Lepton AI提供的类似于Slurm sbatch功能,而非完整的 sbatch超集API。
此外,Lepton AI的控制台仪表板,是其一大亮点。
用户可以轻松查看节点生命周期,实时监控每个节点当前的作业和状态,可视化功能仅次于CoreWeave的节点生命周期仪表板。
并且,Lepton AI推出的开源解决方案gpud,已经为大多数被动健康检查项目提供了全面的支持。
虽然这个被动GPU检查系统仍在持续优化中,但已经算是非常强大的解决方案。
此外,Lepton AI也会提供手动主动健康检查功能,比如DCGM诊断和nccl-tests,但这些检查需要通过UI仪表板手动运行,不像CoreWeave那样能够自动按周进行定期检查。
还不足的是,Lepton AI没有提供NCCL测试的参考数值,也缺少Megatron Loss收敛主动健康检查或Nvidia TinyMeg2静默数据损坏(SDC)检测器主动健康检查。
另外,Lepton AI还提供了一些测试版功能,比如一键式零影响NCCL分析器。
只需点击一个复选框,就能充分利用其自主研发的内部NCCL分析器来可视化集体通信瓶颈,这样就能帮助客户优化网络性能瓶颈。
贾扬清:Caffe之父,AI框架缔造者
提到贾扬清,可以说是业内耳熟能详的「框架大神」。
作为主流AI框架Caffe创始人、TensorFlow的作者之一,PyTorch 1.0的共同缔造者,他的贡献早已深入AI开发的每个角落。
贾扬清,浙江绍兴人,本科和研究生阶段都就读于清华大学自动化专业。
在研究生学习期间,他曾在新加坡国立大学、微软亚洲研究院、NEC美国实验室和谷歌研究院工作/实习,积累了丰富的实践经验。
2008年,他赴往加州大学伯克利分校攻读计算机科学博士,导师是Trevor Darrell教授。
在博士期间,他创立并开源的深度学习框架Caffe。这个框架一经推出,因其高效性、易用性迅速走红,被微软、雅虎、英伟达、Adobe等公司采用。
毕业后,2013年,贾扬清正式加入谷歌大脑团队,在Hinton和Jeff Dean等人的带领下,参与了TensorFlow平台的开发 。
此外,他还与同事一起建立了全新深度学习架构GoogLeNet——首个在图像分类任务中,超越人类准确性的神经网络。
3年后,贾扬清转投Facebook(Meta),在Yann LeCun领导下担任研究科学家,并在2017年,晋升为AI架构总监。
在此期间,贾扬清在AI架构的大道上一路进击:
· 2016年11月,Facebook推出轻量级模块化的深度学习框架Caffe2Go,让手机也能运行深度神经网络模型。
· 2017年4月,Facebook宣布开源产品级深度学习框架Caffe2,带来跨平台机器学习工具。
· 2017年,创建了首个开放模型格式ONNX原型,后来被FB、微软、亚马逊等公司联合推广。2018年5月,Facebook正式公布的PyTorch 1.0整合了ONNX格式。
2019年3月18日,贾扬清加入阿里达摩院,担任技术副总,负责大数据以及AI方向的技术、产品和业务。
直到2023年3月,他官宣离职,并在几个月之后创办了Lepton AI。
根据个人主页,贾扬清被引数最高的三篇论文,TensorFlow和Caffe赫然在列,他的每一步都推动了深度学习工具普及与进化。
曾有网友戏称,学物理绕不开牛顿,搞深度学习,绕不开贾扬清。
参考资料:
https://techcrunch.com/2025/03/26/nvidia-is-reportedly-in-talks-to-acquire-lepton-ai/
https://semianalysis.com/2025/03/26/the-gpu-cloud-clustermax-rating-system-how-to-rent-gpus/#introduction