机器之心报道

机器之心编辑部

昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。

目前,新版本在 Hugging Face 上可以下载并部署。



  • Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main

不过,DeepSeek-V3-0324 没有公布详细的模型卡。我们只能看到它的参数为 6850 亿以及张量类型。



此外,DeepSeek-V3-0324 支持了更宽松的 MIT 开源协议。



模型放出来后,DeepSeek-V3-0324 的代码能力让所有人震惊了!

有人表示,经过自己的测试,DeepSeek-V3-0324 在数学推理和前端开发方面的表现优于 Claude 3.5 和 Claude 3.7 Sonnet。



图源:https://x.com/selcukemiravci/status/1904311856313028870

X 博主「@KuittinenPetri」表示,Anthropic 和 OpenAI 陷入了困境。更新后的 DeepSeek-V3-0324 可以轻松免费地创建漂亮的 HTML5、CSS 和前端。



图源:https://x.com/KuittinenPetri/status/1904224441384771909

提示词如下:为 AI 公司「NexusAI」创建一个外观精美的响应式首页,将所有内容包含在一个 HTML5 文件中。结果如下图所示,所有图像,包括用户故事和他们的面孔,一切都是用这个提示完成的。

他认为:DeepSeek-V3-0324 是 DeepSeek 最好的非推理模型,通常更适合创意写作任务,但现在也比 R1 更适合制作 HTML5 + CSS + 前端。上述提示的结果代码总共 958 行,但它实际上实现了一个交互式网站,包括所有图像。并且结果也适用于移动设备。





他还称,DeepSeek-V3-0324 在编写代码方面确实很棒!早期测试显示,它是所有开源选择中最好的非推理模型,甚至可以与 Claude 3.5/3.7 Sonnet 相媲美。



另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。





这位网友还把提示语放出来了,简单的几行字,大家可以前去一试。



Hyperbolic 联合创始人兼 CTO Yuchen 称自己的氛围测试显示,DeepSeek- V3-0324 已经有了一些思维链模型的影子。

他测试了题目「strawberry 中有多少个 r」,可以看到,DeepSeek-V3-0324 展示了详细的推理步骤。他表示,真正的「Open AI」又赢了。





图源:https://x.com/Yuchenj_UW/status/1904223627509465116

还有人将 DeepSeek-V3-0324 与 OpenAI o1-pro 生成小球的效果进行了比较。下面是 o1-pro 的效果:



他表示,DeepSeek-V3-0324 大约可以实现 o1-pro70% 的性能,但它免费并且 API 价格比后者便宜了至少 50 倍。二者选谁一目了然!



图源:https://x.com/michaelkaoi/status/1904178015833297342

X 博主「orange.ai」对 DeepSeek V3、DeepSeek-V3-0324 与 Claude Sonnet 3.7 的海报设计结果进行了比较,同样表示前端代码能力相比上代有了显著增强。





图源:https://x.com/oran_ge/status/1904306405823467526

ad1 webp
ad2 webp
ad1 webp
ad2 webp