伴随着优惠期的结束,DeepSeek-V3 API 价格上调了。
2025 年 2 月 9 日,DeepSeek-V3 结束了发布之初宣布的优惠价格,从原来的输入价格(缓存命中/缓存未命中)每百万 tokens 0.1 元/1 元、输出价格每百万 tokens 2 元,分别有不同程度的上调:
每百万 tokens 输入价格为 0.5 元(缓存命中)、2 元(缓存未命中),输出价格为 8 元。
图/ DeepSeek
尽管比起之前的价格有不小的上涨,尤其是缓存命中和输出的价格是原来的 4-5 倍,但 DeepSeek-V3 的价格整体仍然远低于目前最顶尖的闭源大模型 GPT-4o 和 Claude-3.5-Sonnet。
价格调整,也意味着 DeepSeek-V3 从「试运营」的阶段进入到一个新的市场阶段。在AI 领域,API 价格变动远不只是一次简单的调价,而是当下大模型市场竞争格局变化的一个缩影,尤其是在 DeepSeek-V3、GPT-4o 等非推理类的大模型上。
大模型的 API 费用直接决定了大模型在企业级应用和开发者生态中的吸引力,尤其是主流大模型之中。在 DeepSeek 分别推出 V3 与 R1 之前,OpenAI 和 Anthropic 依靠封闭生态的高端模型占据主导,而 DeepSeek-V3 通过极具性价比的 API 迅速杀入战场,成为开发者最炙手可热的选择。
但现在,DeepSeek-V3 面临的挑战明显在加剧——你没看错,“当红炸子鸡”DeepSeek也面临着挑战。
不仅仅是 OpenAI 和 Anthropic 都在推出更有价格竞争力的模型,越来越多的竞品正在迅速崛起,尤其是这段时间,Google(Gemini)、阿里(通义千问)、以及另一家「新生代」国产大模型 MiniMax 分别都推出了新一代的大模型,在性能和价格上对齐 DeepSeek-V3、DeepSeek-R1。
以 Google Gemini 2.0 系列中对标 GPT-4o 的「中杯」Gemini 2.0 Flash 为例,每百万 tokens 的价格也来到了:
输入 0.1 美元/ 输出 0.4 美元(分别约合人民币 0.73 元和 2.9 元)。
Gemini 2.0 Flash API 价格,图/谷歌
如果说 DeepSeek-V3 的杀手锏是「高性能+低价格」形成的「平替」能力,那么现在,它的价格似乎不再那么独领风骚,而 MiniMax、Google 的新一代大模型正在补齐成本和性能上的短板,逼近它的竞争优势。
毫无疑问,DeepSeek 改变了整个大模型行业,但在越来越多强有力竞争对手的围攻下,它的性价比仍然是最强的吗?DeepSeek-V3 还能保持曾经的性价比神话吗?
全球六大模型PK,DeepSeek性价比优势正在减弱
事实上,全球大模型市场卷到今天,已然进入了白热化的阶段,单独讨论性能或者价格很难说明什么,关键还是要看性能和价格的平衡,这也是大模型市场目前竞争的关键。
而在 DeepSeek 席卷全球之后,大模型市场也陆续出现了多个重量级选手,API 价格战也愈演愈烈。想要了解 DeepSeek-V3 目前的性价比和竞争优势,当然也要对比目前最新一代顶级大模型中性能接近(对齐)的几款大模型:
- GPT-4o
- Claude-3.5-Sonnet
- Gemini-2.0-Flash
- Qwen2.5-Max
- MiniMax-Text-01
其实从各家看齐的模型就能看出,基本离不开 GPT-4o、Claude-3.5-Sonnet 两大闭源顶级模型,不管是 DeepSeek 官方就直言 V3 在性能看齐 GPT-4o,另外不管通义千问(Qwen)还是 MiniMax,往往在对比也都是以 GPT-4o、Claude-3.5-Sonnet 为目标。
Qwen2.5-Max 跑分对比图,图/阿里
此外,Google 最近两年也基本追上了领先水平,在 Gemini-2.0-Pro 对标 OpenAI-o1、DeepSeek-R1 之余,Gemini-2.0-Flash 则是再次惊到了不少人。与此同时,阿里也在稍早前推出了号称超越 DeepSeek-V3 的 Qwen2.5-Max,还有国内 AI 创业公司 MiniMax 推出的 MiniMax-Text-01,同样有很强的竞争潜力。
之所以选择这六款模型进行对比,是因为它们的性能已经进入同一梯队,虽然各有侧重,但在不同场景下都能提供非常出色的性能表现。同时雷科技也整理了这六款模型在 API 定价上的最新情况:
(单位:每百万 tokens,数据来源:官网)图/雷科技
从价格的简单对比来看,DeepSeek-V3 仍然是最便宜的高性能大模型之一,但它的性价比却不再是独一档的存在。
GPT-4o 和 Claude 3.5-Sonnet 依然是最昂贵的模型,价格高出 DeepSeek-V3 近 10 倍,但其在多模态、泛化能力以及综合能力上的优势依然存在,不少开发者可能还不会放弃。
比如说新一轮大模型中的「搅局者」MiniMax-Text-01,尽管有着最低的输出价格,以及最长的上下文窗口,但并仅限文本。当然,MiniMax 同时也发布了单独的视觉多模态模型 MiniMax-VL-01。
Hailuo AI 是 MiniMax 旗下服务,图/ MiniMax
而 Gemini 2.0 Flash 在系列中定位「中端旗舰」,输入价格仅 0.1 美元,虽然比 DeepSeek-V3 稍贵一些,但输出价格更加便宜,仅 0.4 美元,性价比可以说非常逼近 DeepSeek,而且还拥有 Google 强大的搜索和内容生态,。
至于 Qwen2.5-Max,官网仅显示 Qwen-Max 型号模型的定价为输入 2.4 元、输出 9.6 元(输入 $1.60,输出 $6.40),并没有明确指出 Qwen2.5-Max 的定价,可能会调整策略,因此还要继续观望。
DeepSeek-V3 最便宜,但不再是“闭眼选”的对象
API 价格是开发者评估大模型的第一道门槛,但它并不是唯一的决定因素。当价格的优势被竞争对手逐步逼近,DeepSeek-V3 还能维持它的市场吸引力吗?
曾几何时,开发者在选择大模型时,往往面临「性能 VS. 成本」的权衡。GPT-4o 无疑是最强大的模型,但动辄每百万 tokens 输入 $2.50、输出 $10,让许多创业团队望而却步。Claude 3.5-Sonnet 的价格更贵,尽管它在长文本推理上表现出色,但$3.00/$15.00 的 API 价格也不是一般公司能负担的。
相比之下,DeepSeek-V3 的超低价策略让它一度成为「最划算的高端 LLM」,尤其是在代码、数学推理和中文任务上具备稳定的竞争力。
图/ DeepSeek
但今天的市场变了。
同为国产、开源免费的大模型,MiniMax-Text-01 不仅能提供4M tokens 的超长上下文窗口,更是以输入 1 元/输出 8 元的 API 价格,直接冲击 DeepSeek-V3 的市场定位。对于需要处理长文本的应用,比如法律咨询、合同分析、长篇内容摘要,MiniMax 成为更具吸引力的选择。
而在海外市场,DeepSeek-V3 也要面对 Gemini 2.0 Flash 的威胁。不仅 Google 的 API 价格 综合来看已经非常接近 DeepSeek(输入 $0.10 / 输出 $0.40),同时 Google 生态整合能力(直接访问 Google 搜索、整合 Gmail、YouTube、Google Drive)也足以让它成为许多企业的首选。
在这种情况下,开发者会如何决策?
如果是对成本极度敏感的初创团队,DeepSeek-V3 可能仍是很好的选择。它的输入价格不仅远低于 GPT-4o 和 Claude,甚至比 Gemini 2.0 Flash 还便宜。如果你的应用主要是标准对话、代码生成、中文处理任务,DeepSeek-V3 依然是最具性价比的 LLM。
但如果你的应用涉及超长上下文、跨平台生态整合,或是需要更高泛化能力,那么 Gemini 2.0 Flash 可能会成为更好的选择。DeepSeek-V3 的主要问题在于它的性价比优势已经不再「独一无二」,它依然便宜,但不再是唯一的低价高性能选择。
从开发者的角度来看,DeepSeek-V3 仍然值得使用,但已经不再是「闭着眼选」的最优解。
维持性价比优势外,DeepSeek还需更稳定
如果说 AI 价格战是一场不见硝烟的持久战,那么 DeepSeek-V3 这次调整,可能才刚刚拉开真正的较量。但同时也要说,对于用户来说选择可能还不一样。
许多人第一次接触 DeepSeek-V3(或者 R1),并不是通过 API,而是 DeepSeek 官方网页或者 APP 提供的服务:免费,而且可以随时体验到全球顶级的 AI。但在现实中,这种免费还伴随着「服务器繁忙」的提示,让用户体验大打折扣。
可太忙了,图/雷科技
尤其是高峰时段,DeepSeek-V3(或者 R1) 经常无法正常响应,甚至连基础对话任务都无法完成。相比之下,OpenAI 的 ChatGPT Plus 订阅虽然收费,但稳定性很高,让不少用户仍然愿意为「流畅体验」买单,包括小雷在内。
这可能也是「当红炸子鸡」DeepSeek 当下很重要的一个问题,要么扩大基础设施,要么提供付费订阅「门槛」,不然很难解决问题。