PPIO派欧云联合创始人兼CEO姚欣

中国开源大模型DeepSeek又“崩”了。

钛媒体AGI获悉,3月11日凌晨,DeepSeek称,其R1网络/API服务不可用,随后开始调查,直到十多分钟后DeepSeek才表示,关于R1网页/API服务的问题已得到解决。


事实上,这并非首次。自春节爆火以来,DeepSeek频频回复的“服务器繁忙,请稍后再试”,让各地用户抓狂。

然而,DeepSeek日前却发布文章称,包括了网页、APP 和 API 的所有负载在内,如果所有tokens全部按照 DeepSeek R1 的定价计算,理论上一天的成本利润率545%,震撼了市场。但很多人并不同意这一说法,认为545%数据有误导之嫌。

“545%只是一个理论数字,DeepSeek发表的文章里面也写了,如果全行业545%,大家都别干了。”PPIO派欧云联合创始人兼CEO姚欣近期独家对钛媒体AGI表示。

姚欣指出,尽管DeepSeek拥有很多的创新技术,但这份没有收入起伏的数据,证明了DeepSeek全天近16个小时都是在峰值期,没有办法完整地满足用户的请求和服务,这样的服务质量是“不及格”的。

作为首批适配DeepSeek模型的AI算力厂商,PPIO派欧云成立于2018年,由PPTV创始人、前蓝驰创投投资人姚欣(Bill)和首席架构师王闻宇联合创立,主要在网络边缘侧构建分布式云计算服务,科技“按需付费”形成商业落地。

姚欣曾形容,PPIO派欧云是“算力版的滴滴”,主要整合企业侧闲时碎片化的算力,承载多种服务,包括音视频和AI推理等。

DeepSeek-V3/R1模型发布之后,PPIO派欧云率先开启适配工作,据SuperCLUE发布的DeepSeek-R1网页端稳定性测评报告显示,第三方平台服务中,PPIO派欧云的满血版 DeepSeek-R1准确率达100%,从而为客户和开发者提供稳定、准确支持。

在姚欣看来,PPIO派欧云最独特的价值其实是“弹性”调用资源,拥有一套分布式系统,能够根据用户需求动态调整,从而释放DeepSeek官网峰值压力,解决DeepSeek自身服务问题。

3月6日,PPIO上线高性能版Deepseek R1/V3 Turbo(全参数满血版)版本,吞吐速度达到30 TPS,是之前版本的3倍,满足高并发场景需求,当前活动价8折优惠,Deepseek V3 Turbo低至每百万tokens 1.6 元。

姚欣对钛媒体AGI表示,长期来看,在AI基础架构中,MaaS中间这一层赚不赚钱不重要,而是要实现开源和标准化,使得MaaS越来越普及、平权,最终会走向开源化。整个行业都有很长的路要走,都在不断的你追我赶的加速过程中,而DeepSeek在鼓励更多模型开源,实现创新技术的加速进步。

姚欣依然坚持,未来三年,AI 大模型推理成本或将下降1000倍以上,在计算资源成本高昂而需求暴增的市场格局下,分布式算力将成为引领下一轮发展的重要推动力。

“从去年5月至今,PPIO派欧云平台80亿参数规模的模型价格下降了一半以上,同一代模型情况下,一年时间后API调用价格下降10倍,这是我们能看到的一个基本趋势,今年如果新的模型出来,肯定有新的降本空间。”姚欣指出,整个市场已经形成 AI 推理、AI商业落地等“共识”,因此公司今年会加大应用落地、接纳客户服务、兼容更多国产GPU卡等服务。

姚欣强调,推理算力成本的持续下降,必然会带来AI应用大爆发。未来两年,中国AI会进入到“免费应用”时代,即AI推理成本会低于AI应用通过广告或增值服务的变现收入,不向用户收费,就能免费实现AI应用。

以下是姚欣和钛媒体AGI之间的独家对话编辑(有删减):

钛媒体AGI:DeepSeek日前首次披露其理论成本利润率545%,您怎么看待这一数据?

姚欣:我相信大家都很清楚这个数字,545%只是一个理论数字,DeepSeek发表的文章里面也写了,如果全行业545%,大家都别干了。

我们的确也做了很多拆解和解读,主要有三点:

一是DeepSeek做了很多非常独特的创新,对于我们的一个启发在于,很多 AI 模型和推理采用单机单卡、单机多卡,一个单机上面跑。之前在做模型训练的时候,没有很好的思考它未来怎么部署。而如今,DeepSeek清楚地知道未来要在多少集群部署,模型架构上,核心就是专家并行策略,等于把专家并行分布在很多机器上,跟我们PPIO派欧云对于分布式推理的的理解其实有异曲同工之妙。

第二,成本率还是一个理论值,比如它的资源利用率全天几乎都是满的,只有在凌晨的时候有波谷,成本也没有下降多少,所以它用降价的方式把它卖出去,再把利用率拉升。


但是我要抱歉的说,作为一个真正服务过4.5亿用户,大规模互联网应用(PPTV)的创始人来讲,这是一个理论、理想的情况。服务是什么?简单来说,任何一个互联网应用服务,它全天流量一定是有波峰、波谷,有点像正弦曲线。但是,如果在你最高峰的时候,突然变成一条直线了,这意味着,在那个时间段用户请求进不来。

所以总结来说,春节期间DeepSeek的服务崩溃,满足不了用户、企业服务。同时,这也证明 DeepSeek 全天近16个小时都是在峰值期,因此无法完整地满足用户的请求和服务,这样的服务质量我觉得是“不及格”的。

因此,DeepSeek的服务和技术架构更进一步需要“弹性”算力,才可能解决这样的问题。PPIO派欧云在春节期间第一时间接入DeepSeek,利用分布式推理实现更大的负载均衡与优化,来保证客户的服务质量、稳定性。

钛媒体AGI:正如您所讲,DeepSeek一直是服务器繁忙,也可能是成本原因,如今,我们看到一些已接入DeepSeek的厂商速度变慢了,您团队是如何处理这种平衡的?

姚欣:我们做了企业和用户版本的区分。

其中,企业客户优先服务,春节期间10倍暴增流量,但PPIO派欧云支持的DeepSeek-V3/R1 服务可用性99.9%,所以我们是整个春节期间为数不多能够全程扛下来如此大流量的供应商。

在我看来,PPIO派欧云最独特的价值其实是“弹性”调用资源,能够根据用户需求动态调整。我们存储了大量分散的数据中心和计算资源,拥有一套分布式系统,所以这次春节我们做得还是不错的。

钛媒体AGI:随着DeepSeek爆火,很多投资机构、各地政府都被问到为什么错失了DeepSeek,创业之前您也曾是一名投资人,您怎么看待这件事?

姚欣:我觉得投资人miss(错过)项目很正常,有哪个投资人能把全球最好的项目都能拿过来,很难,何况还有一个特点,DeepSeek不差钱。

其实我觉得,好公司就应该这样,一方面有足够强的现金流支撑创始人去实现他的梦想,融资只是补充现金的一种手段,不能因为有融资方式,所以一味烧钱去补充(流量或收入),而是更多需要企业有一个盈利业务的服务,就像DeepSeek和梁文锋一样,幻方有发展的业务。PPIO派欧云也是如此,才敢大胆、放心在这个行业里面拼杀。

钛媒体AGI:有些人认为接入DeepSeek之后,MaaS(模型即服务)公司不赚钱,甚至亏损4亿元,您怎么看?

姚欣:MaaS定义的是推理加速和服务中间层。我自己从PPTV时期就做视频云服务,所以在我看来,上一轮SaaS(软件即服务)和IaaS(基础设施即服务)市场份额能占到8成以上,PaaS规模很小,而MaaS相当于AI领域的中间层。

因此,你会发现,在任何一个行业里面的中间层几乎都不赚钱,无论是开源数据库,还是操作系统本身,都是靠生态、上下游产业链赚钱。所以我自己当时的一个洞察和思考是,中间是标准统一层,目的是将下层IaaS的各类异构到基础设施进行抽象和虚拟化,对上层SaaS暴露标准统一的技术能力,让开发人员更加简化,直接基于中间的平台去编程,这是它的价值。

如今,长期来看,在AI基础设施架构里面看,MaaS中间这一层赚不赚钱不重要,我认为是要长期实现它的开源和标准化,使得MaaS越来越普及、平权,甚至最终会走向开源化。而PPIO派欧云也在这里面做了很多推动作用,接下来也会发布一些开源技术,并且支持贡献开源生态。而PPIO并不直接从MaaS层挣钱,我们是卖算力送模型和优化,会结合自身的弹性IaaS一起搭售,以实现极致性价比和弹性的开源模型服务。

当然,要走到极致,整个行业都有很长的路要走,都在不断的你追我赶的加速过程中,而开源就是“你中有我、我中有你”,DeepSeek在鼓励更多模型开源,大家互相学习、互相进步当中,所以开源就是一个技术加速进步的最好方式。

钛媒体AGI:这一轮接入DeepSeek服务的厂商中,大部分不是“满血版”(671B参数),这块的难点在哪里?

姚欣:这是我们的业务,所以很多模型都是第一时间接入的,不止是DeepSeek,还有Llama、阿里通义千问等。事实上,2023年PPIO派欧云开始在智能算力云方向发展的时候,就提出了两点:一是聚焦推理,分布式架构不做训练;二是开源,给这些开源模型提供上线服务。

春节期间,DeepSeek开源模型出现后,我们第一时间解读觉得非常惊艳,所以很快评测和上线“满血版”,我们工程师也很辛苦和给力,连夜优化改进,给客户最好的服务。我认为,DeepSeek模型性能提升会极大解放很多新的应用场景可能性,而开源模型又会极大地降低使用成本,对于我们这样的企业来说是一个巨大利好,所以一定是全力以赴支持,帮助我们的客户和企业来快速使用。

我相信接下来的几个月里面,我们还会有更多客户接入,实现PPIO派欧云收入的增长。

钛媒体AGI:但很多国内大模型公司,如“六虎”当中的企业,都不再做预训练基座模型了,未来可能有更多闲置模型,那么PPIO派欧云还会完整接入吗?

姚欣:我们200多个模型不全是开源基座模型,还有各种微调和多模态模型。

同时,我也认为,底座模型的确不需要太多,这其实就像操作系统、搜索引擎一样,并不需要100个,而大量基于底座的垂直行业模型、微调模型、模型应用等,反而会使得生态越来越繁荣。现在整个开源模型的性能都在大幅的提升,接近于闭源,这已经成为一个行业趋势了。

此外,在多模态层面,我们现在还在对接音频声音克隆,以及开源的视频生成模型。

钛媒体AGI:你认为AI Infra行业真的有机会赚到钱吗?

姚欣:PPIO派欧云在进入这个行业的时候,我们不会只做中间这一层,而一定是自下而上做,我们底层具备极强弹性的闲置闲时资源池,以及全球全网的算力调度能力,还有二十年经验的分布式架构积累,未来一旦应用需求爆发,除了追求性价比之外,弹性非常重要,否则在高峰期用户都无法正常访问,还何谈商业模式,何谈未来的竞争和盈利。

这个有点像移动互联网的早期,先把用户服务好,伴随一波一波峰值事件带来增长,再通过智能算力云服务打差异化,做分布式推理,做商业To B(企业级)服务,提供开源、更好、降本的解决方案,与生态一起促进整个生态普及、发展和繁荣。

钛媒体AGI:去年英伟达股价攀升,市值超过3万亿美元,但今年,在DeepSeek热潮下,英伟达股价已累跌18.52%,市场认为大模型成本降低,使得AI算力需求没那么强了,您怎么看当前国产卡,以及AI算力市场需求转变的趋势?

姚欣:我认为,国产算力在训练阶段比较艰难,但R1这种推理模型,让国产算力机会到了,推理侧不再唯芯片性能(计算)论,而显存(存储)、并联机制(通信)变得更加重要,这更有利于国产卡发展,也让国产卡性能会有进一步提升。

对于算力需求,我的观点:

第一,未来的算力会持续增长,但算力构成会发生重大变化,2024年英伟达60%算力卡使用场景在训练、40%是推理,而未来推理场景的占比会大幅提升,这与用户使用量、模型规模和用户活跃度有关。

第二、从全球来看,当前AI应用的渗透率还相当于2011年移动互联网阶段,所以,它还有百倍、千倍增长机会。哪怕训练算力市场增长放缓了,但推理算力市场会实现爆炸式增长,总体算力规模会持续高增长。

钛媒体AGI:很多企业去做DeepSeek一体机,PPIO派欧云有考虑吗?

姚欣:一体机跟国产卡适配没有什么相关性,大家想做“一体机”的原因,还是客户的不同需求。

在公有云、私有云、专有云三种形态下,各自有不同特点和使用形态,我认为,“一体机”属于私有云或专有云范畴,它在内部系统部署,解决的是企业数据不出境、不出体外,数据在内网来跑,有安全,有隐私,所以这个(做一体机)很正常。

此外,成本结构也不同,公有云对于客户来讲使用成本最低,使用门槛使用最方便。如果是私有云的话,需要付出硬件成本,一次性买机器可能要分到3年、5年才能慢慢摊销下来,而硬件贬值速度要快得多,同时对于企业客户来说,数据不能出界也很重要,所以会有一体机这种特殊需求。这和移动互联网早期大家都想自己建数据中心存数据,后来才意识到公有云比自建和运维更划算,需要一个教育过程。

当然,我们也是要看客户有什么需求和服务,但PPIO派欧云目前主要还是以公有云为主,大量互联网、C端场景更多。针对个别数据敏感的行业客户,或只需要在企业内网访问需求的,我们也会提供基于一体机的私有化部署方案。

钛媒体AGI:您如何评估投资人想要的短期利益,和技术企业的长期价值?

姚欣:首先,越是底层的创新,周期越长、越缓慢,这是一个客观事实。

比如,英伟达成立31年了,谁能想到它今天成为AI时代最大“军火”供应商。所以,任何底层技术都是一个长周期的事情。创办PPIO派欧云的第一天,我就认为我们想把分布式架构铺遍全球、走向全球,这不是一个三年、五年的事情,而是一个长期的事情,需要10年、20年我们才能把这套技术真正的标准化、普及化,然后所有应用都降落在这之上,也要等待这个行业的机会发展和变迁,这需要长期性。

其次,投资人是有分工的,有些是长期,有些是短期,当年美元基金的早期VC,LP的回报周期就可以达到12年,有些基金募资周期就是3~5年,他就要在5年内退出,有些投资后期,有些投资成长期,所以我们更需要的是一个生态的繁荣,因为投资这件事情永远叫做“反共识”,人多的地方不好赚钱,但是希望每个地方都要有人。其实我们也是希望,这几年整个国内投资、上市、并购环境更好一些,全链条都要转起来,因为金融是流动的,当然我们也看到国家也在慢慢重视这件事,需要更多所谓“耐心资本”来陪跑这个过程。

最后,人民币基金此前缺位于早期投资,如今也投早、投小、投硬科技,甚至我还看到前段时间某些地方允许国资投失败案例。所以,中国的一级资本市场也在逐渐走向长期投资过程。

当年PPTV也是2004年到2014年做了10年,还不能算是大成的,我做到今天,视频行业这都已经快20多年了,所以真的是需要长周期陪跑,这些投资人也非常值得尊重。

钛媒体AGI:当年卖掉PPTV,当时您有没有比较痛苦的时期?

姚欣:这是十多年前了。谁不想让自己的孩子上清华北大,我也希望“我的孩子”能去纳斯达克敲个钟,也希望成为今天如字节一般闪耀的存在。但随着竞争过程中,我觉得企业并购退出是个常态,2016年我在蓝驰做了投资人后发现,90%以上的企业都是以并购的方式退出,IPO退出不到10%,所以这是一个普及的事情。

痛苦是短时的,但真正对创业者来讲,技术是长期的事情。从PPTV到PPIO,我离我的梦想越来越近了,今天的PPIO是在承载我当年的梦想,科技创新改变生活,希望分布式架构成为未来新的基础设施和底座,我们还是沿着当年的梦想一直在往前走。

钛媒体AGI:但国内 AI 领域的竞争过于激烈了。

姚欣:客户竞争在哪都有,所有的机会都是在竞争过程中不断优中选优,不断打磨,每一家企业应该有自己的核心竞争力,我们希望把技术独特性做好,提高自己的护城河,自上而下、从软到硬都能够去完成这一系列的优化。我觉得每一家企业都应该在自己擅长的地方持续发展,每家企业都应该有自己的差异化和核心壁垒。

钛媒体AGI:去年您说“未来三年AI模型推理成本下降1000倍”,那随着算力需求增加、算力卡不断迭代,这个推理成本未来还会降低吗?

姚欣:首先,包括OpenAI在内全行业的模型价格都在持续下降。

其次,去年5月至今,PPIO派欧云平台80亿参数规模的模型价格下降了一半以上,今年中估计就能实现一年降10倍的目标。对于deepseek这类新的模型出来,我相信半年后就肯定有新的降本空间。

我还是有信心,实现“3年推理成本下降1000倍”这一长期目标,同时我们认为,未来两年,中国AI会进入到“免费应用”时代,即AI推理成本会低于AI应用通过广告或增值服务的变现收入,不向用户收费就能免费实现AI应用,因为当年游戏从收费到免费、视频从收费到免费,迎来了大爆发,都证明这一点。

钛媒体AGI:但是我们看到,像腾讯元宝、字节豆包等 AI 应用都在投流烧钱。

姚欣:我相信大家都是理性决策的,不会去做这种简单烧钱。有些厂商也觉得烧钱不合理,所以我相信这些大厂也会有自己全面的思考方式。

对于PPIO派欧云来说,我们看到整个市场已经形成 AI 推理、AI商业落地这些“共识”,和我们公司定位一致,因此今年团队会加大应用落地、接纳客户服务、兼容更多国产GPU卡,实现同等模型参数下成本每年下降10倍。这种持续下降,必然会带来AI应用大爆发,从而让我们有望迎接到“更大的蛋糕”。

(本文首发于钛媒体App,作者|林志佳)

ad1 webp
ad2 webp
ad1 webp
ad2 webp