经济观察报 陈奇杰 任晓宁/文 3月31日,智谱在中关村论坛上发布其最新智能体(Agent)产品AutoGLM沉思。这款产品结合了深度研究能力和操作能力,强调边想边干,即一边思考一边帮助用户完成复杂问题。

智谱CEO张鹏在发布会上表示,大模型的预训练和后训练存在Scaling Law(规模定律)。智谱发现,Agent也存在类似的Scaling Law。通过扩展训练时的inference compute(推理计算),智谱观察到Agent展现出了更强的性能。

Scaling Law是描述模型性能如何随着模型规模(如参数数量)、训练数据集大小以及用于训练的计算资源增加而提升的一组经验法则,被业界认为是大模型预训练第一性原理。

张鹏说,在Agent Scaling Law的基础上,智谱进一步发现了Agent也存在能力涌现。例如,尽管智谱在训练过程中从未教给AutoGLM沉思访问巨潮资讯网,但当发送指令“帮我收集昨天关于具身智能的相关研报”时,AutoGLM沉思能够规划出通过访问巨潮资讯解决问题的方案,并顺利操作了网站。

张鹏在现场还演示了AutoGLM沉思更多的能力,它可以像人类一样打开并浏览网页,完成数据检索、分析,并生成万字报告。此外,当用户要求AutoGLM沉思赚钱时,它可以自主选择通过写稿挣钱,并完成从上网搜索征稿启事、根据要求构思写稿、通过邮件向平台投稿获取稿费等一系列操作。

张鹏称,AutoGLM沉思的能力实现依赖于三个关键技术:一是深度思考,能够模拟人类在面对复杂问题时的推理与决策过程;二是感知世界,能够像人一样获取并理解环境信息;三是工具使用,能够像人一样调用和操作工具,完成复杂任务。

同时,与一般的推理模型不同,AutoGLM沉思的思维链更长,会一直不断地思考、反思、纠错,再加上调用工具,以至于完成一项任务的时长有时长达10分钟以上。

据张鹏介绍,AutoGLM沉思背后是智谱GLM全栈自研大模型,包括推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中前者不仅性能比肩DeepSeek-R1,在速度提升最高8倍的同时,价格还仅需DeepSeek-R1的1/30。智谱将于4月14日开源基座模型GLM-4-AIR、推理模型GLM-Z1-Air、沉思模型GLM-Z1-rumination。


陈奇杰经济观察报记者

TMT新闻部记者
长期关注并报道TMT(科技、游戏等)领域重大事件,擅长人物专访、行业分析报道。
邮箱:chenqijie@eeo.com.cn 微信号:Q1191278317

ad1 webp
ad2 webp
ad1 webp
ad2 webp