对于AI大模型不是很了解,特地去看了一些专业博主的视频,了解了大模型的原理,有个博主科普非常容易理解,这个博主说大模型量化就是压缩,蒸馏就是模仿,在原有基础上通过精简提取,让内容更加简单明了。

之前我看很多网友都在试数值的比较,刚开始的比较有的回答正确,有的错误,根据我们输入的数字有关系,比如数字后面有没有单位,或者是0,比如1.10和1.1,出来的答案就会有差异。

刚才我让DeepSeek和豆包回答同一个问题,看他们的回答有什么区别?

我提出了一个问题,总结2025年春晚的口碑,哪个节目被吐槽最多,总的来说还是好的,但还是有点欠缺。







先看看豆包的回答,赢的好评的是凤凰传奇的《栋梁》,毛不易与莫文蔚的《岁月里的花》,王菲的《世界赠予我的》,语言类节目反响平淡,小品《借伞》和《金龟婿》吐槽最多。

马丽沈腾的丈母娘,沈腾装嫩演28岁的青年,还有就是没有结尾,很多观众都说跳的太快了,没看到结果,因为是被第一个节目《借伞》占用了时间。

豆包的回答整体也还可以,豆包的回答是根据3篇文章总结。



再来看看DeepSeek的两个回答,一个是“联网搜索”,这应该就是全网相关内容上搜索经过总结的出来的答案,而且是搜索了19个网页,数据比较庞大,比较负责任,比豆包查看了更多的资料。

DeepSeek第一个回答和豆包差不多,也就是这几个问题说明。









再来看看DeepSeek的深度思考,第二遍是没有用联网搜索,只是用深度思考搜索,出来的答案就有点勉强,而且有个别地方还非常搞笑。

我之前提过的问题DeepSeek都给提出来了,之前我提出了1.15元和1.5元的数值比较,还有搜索模型蒸馏,接着又问了关于2025年春节晚会的总结和吐槽。

用户提出同样的问题,因为之前的回答没有完全满足需求,或者是想再次确认信息。

我提出的着三个问题都不是同样的问题,为什么要这样分析我的提问?













这也说明,大模型毕竟是大模型,大模型都是根据原创文章总结后经过量化和蒸馏的结果。

还指出现在当前时间是2023年,而不是2025年,2025年的春晚尚未发生,这些信息可能基于预测或者假设……

真的好无语,DeepSeek为什么会有这样的回答,这个回答是太不正确了,这是宕机了吗?

ad1 webp
ad2 webp
ad1 webp
ad2 webp