沈向洋、漆远在2025 GDC谈开源和智能体展望，商汤发力AGI软件和应用平台

2月21日-23日，2025 GDC全球开发者先锋大会在上海徐汇举办。大会以“模塑全球无限可能”为主题，围绕金融、医疗、教育智能制造等各类场景公司，AI开发工具、多模态大模型、企业级服务以及开源生态等多个领域的技术提供商汇聚一堂，探讨大模型产业化和技术前沿的最新方向。

22日GDC开幕式上，香港科技大学校董会主席、美国国家工程院外籍院士沈向洋，上海科学智能研究院院长、复旦大学浩清特聘教授漆远，阶跃星辰创始人、CEO姜大昕，商汤科技联合创始人、副总裁杨帆等重要嘉宾，分享和探讨关于 AI 大模型、DeepSeek、开源大模型与Agent（智能体）应用等话题。

而22日下午，AI 公司商汤科技还宣布开源可构建多Agent大模型应用开发框架LazyLLM，商汤大装置上线万象平台，包含模型开发平台与Agent应用开发平台，并已上架DeepSeek系列模型，企业客户和开发者可在商汤大装置万象平台中可获3个月内1000万tokens免费使用权益；大模型应用层面，商汤发布全新代码小浣熊2.0、办公小浣熊2.0，实现从Copilot迈向Agent转变。此外，商汤科技联合创始人、首席科学家王晓刚透露，日日新大模型6.0也将在今年发布。

很显然，进入2025年，AI 智能体应用、开源模型软件将成为一个新的趋势。

开幕式：沈向洋、漆远、姜大昕等人谈开源和智能体展望

过去一年，上海持续加大 AI 产业政策创新力度，推动技术攻关，强化全产业链生态布局。

公开信息显示，2024年，上海市人工智能产业规模超过4500亿元，同比增长超过7%，累计完成60款生成式AI大模型备案。

据《关于人工智能“模塑申城”的实施方案》显示，到2025年底，上海要构筑起一个涵盖算力、语料、模型、应用等层面的世界级人工智能产业生态，打造世界级的高端 AI 产业集群。

随着国产DeepSeek大模型的横空出世引发关注，AI 新场景、新应用不断涌现。作为 AI 大模型和算力产业链公司重要聚集地之一，上海等地可能将更快地进入 AI 周期的创新阶段，促使新的产业形态形成、催生出新的就业场景以及潜在消费增长。

美国国家工程院外籍院士沈向洋（Harry Shum）在发表题为《大模型时代的创新与思考》主旨演讲时，充分肯定了大模型时代开源的力量。

“DeepSeek让大家看到开源社区的胜利。把了不起的模型开源后，让更多人得到机会，在这个模型上做更多了不起的事情。”沈向洋指出，从技术进步的角度看，开源并非新事物，但其蓬勃发展始于互联网的出现后。互联网极大增强了全球合作开源的能力。此外，也可以从商业选择的角度理解开源。

沈向洋认为，纵观2023年到2024年不同公司开发的模型在企业实际使用中的比例，市场份额从高到低的大模型中，开、闭源策略各不相同，与其市场份额没有明显关联。因此他认为，开源和闭源不是对立的商业模式，开源还是全球合作的重要领域，中国是开源研究的受益者，现在也是国际开源社区的贡献者。

沈向洋强调，现在来讲，闭源模型的份额实际上还是远远超过开源份额，但可能接下来这一两年，这件事情的改变会非常的大。任何事情都必然有一个平衡方式，因此，我们需要思考未来。

沈向洋表示，对于大模型，之前的研究焦点是GPT模式，现在的焦点是Reasoner（推理）模式，这是一种新的学习范式。

他指出，此前以OpenAI的GPT系列模型为代表，这是一种“快思考”模式，大模型都是在做预训练拓展，主要原理是预测下一个token，而推理模式则注重任务完成，允许反复试错和修正，更接近人类的“慢思考”。模型会先打草稿，反复试错找到正确路径后，总结过程和答案，训练的是模型慢思考的能力。因此，这种新模式通过逐步抽象化复杂问题并推导解决方案，已在视觉推理等领域得到应用。

对于近期广为讨论的人与机器的相处关系到底应该是AI（Artificial Intelligence，人工智能）还是IA（Intelligence Augmentation，智能增强）？沈向洋指出，智能增强（IA）是指通过技术扩展人类的能力，帮助人们更高效地完成任务，而不是取代人类。

在沈向洋看来，大模型里最难的事情之一，是开源数据，因此，需要开源社区能贡献更多数据，在新的范式里，大家一起有更大的进步。

2025年1月，DeepSeek发布开源的推理模型R1，在强大的推理能力之外，还有高性价比的特性，其复现的训练成本仅为o1的4%，Grok-3的0.2%，推理成本仅为Grok-3的18%，o1-mini的3.7%。尽管DeepSeek团队没有参加GDC开幕式，但DeepSeek已然成为全场的关键词。

“DeepSeek在有限算力下的普惠智能，是开源开放的胜利。”上海科学智能研究院院长、复旦大学浩清特聘教授漆远说，开源将有效加速新技术的渗透率，导致 AI 技术大规模的应用。

根据“杰文斯悖论”，这样的高效低耗将加速新技术采用速度和广度，虽然每个token的推理成本降低，但是普及后有更多人使用，总量反而会上升。如今，DeepSeek仅用数百万美元训练成本、以及仅用7天打破ChatGPT 2个月做到用户数破亿记录，使得这种“杰文斯悖论”得到明显的证实与商业成功。

漆远表示，这意味着，今天每个大模型token的推理成本越来越低，但是更多人使用之后，有可能整体token使用量反而更高，底层上大家在海量使用开源技术。另一方面，大家也可能忽略了信任，开源本身其实可以加强大家对开源的信任，低成本带来一个非常大、背后商业上的成功。

据悉，漆远团队已经研发了燧人物质大横型、伏羲气象大模型等多个技术产品，同时，漆远创立的无限光年公司，致力于研发独特的可信大模型及工具链技术，聚焦“一横一纵”的产品体系和全球化发展战略：一横光语启智是“训推用”一站式智算服务平台，是中国领先的专门面向科学智能的智算平台；一纵「光语金帆」精准推理大模型及Agent应用，专为金融专业人士打造的智能助手，光语金帆已在招商证券、汇丰银行等头部金融机构落地应用。

漆远指出，我们其实当前低估了大模型带来的未来发展，也许Transformer之后还有新的架构出现，我们讲稀疏架构，一系列新的技术相信会进一步推进人工智能的发展。“土壤、水分、阳光三位一体”之后，将加速科学智能的发展，而如果我们有了开放的生态，对高校、龙头企业、新锐企业可以产生一个非常好的推动作用。

“我们讲Hacker精神本身，Hacker精神本身就是一个开源，是开源开放的胜利，科学智能需要更多元、更开放的合作。第二个价值放大，Token更便宜，其实使用更多是底层技术快速渗透，科学智能价值会发挥更大作用。”漆远称。

阶跃星辰创始人、CEO姜大昕表示，开源以来，公司的产品收到了非常多的关注和好评，全球创作者使用阶跃星辰的模型创作了海量视频。同时，越来越多的伙伴加入了阶跃星辰的开源生态，包括技术社区、创作社区、云厂商、芯片厂商等。3月，阶跃星辰还将继续开源图生视频产品。

沈向洋强调，未来最大的机会，在于人和机器的关系，即人机交互。他倾向于把人机关系定义为“以人为本的人工智能”，并呼吁关注 AI 伦理问题。

“回看过去四、五十年，整个信息社会的发展，整个计算机行业的发展，最重要的一件事，实际上是人如何去使用计算机，哪个公司抓住了人和机器交互的入口，就会成为世界上最伟大的公司。当年PC时代，Windows这样的产品成就了微软，互联网时代搜索陈旧了谷歌，移动时代成就了TikTok，如今 AI 时代，DeepSeek正在驱动中国 AI 领先地位。”沈向洋称，发展人工智能过程当中，一定要牢记“以人为本的 AI”这样以一个思路，关注到 AI 人才、AI对社会等影响。

商汤发力“大模型+大装置”应用，加速构建AGI平台

DeepSeek热潮下，国内 AI 应用发展成为关键课题，在开幕式上，商汤科技联合创始人、副总裁杨帆提到了一个小故事，引发思考。

“说起落地应用选择，其实这也是满困扰我的问题。商汤也做了很多算法、算力和应用，但现在技术发展太快了，我说要不我问一下2024年非常火的一款大模型，我说2025年会有什么关键的重大机遇，它跟我说4条：应用场景拓展、国产算力突破、数据质量提升、国际竞争优势。我问一下DeepSeek，它就跟我说服务器繁忙，请稍后再试。”

杨帆认为，即便 AI 今天很聪明，拥有了更多的智能，但他还是更多在人类的指引下，帮助我们去更好的学习知识、记忆知识，帮助我们更好的回答问题，到底我们怎么样在日常生活中、产业发展实践的挑战中，能够更好的使用 AI 工具、AI助手，这个需要我们不断的思考、探索与回答。

如今，依靠“大模型+大装置”能力，加速构建AGI目标，是商汤科技全新十年的主线，基于大模型的落地应用也进入了加速期。

2月22日全球开发者先锋大会商汤分论坛上，商汤科技公布了全新多Agent大模型应用开发框架LazyLLM、商汤大装置上线万象平台，以及全新代码小浣熊2.0、办公小浣熊2.0，实现从Copilot迈向Agent转变。

商汤小浣熊负责人贾安亚表示，当前AI的突破方向大致可归纳为“多快好省”四个方面，即更多的模态融合、更快的推理速度、更优的思考能力和更低的训练成本，这使得大模型应用落地进入加速期。

贾安亚认为，大模型应用落地的范式主要为副驾驶（Copilot）和智能体（Agent），二者分别代表模型在不同应用场景、不同环节与人协作的不同模式。商汤小浣熊也正好有代码小浣熊和办公小浣熊两个产品，分别为面向个人和企业的编程助手与面向个人和企业的办公助手。

其中，全新的代码小浣熊2.0在原有代码补全、问答交互的基础上，实现了多维度的数据融合和多模态推理等能力，不仅面向C端用户提供更高效、智能的代码编写和开发任务，还面向企业提供从需求分析、测试迭代到代码资产管理的端到端软件开发解决方案。实际应用中，代码小浣熊可帮助开发者提升编程效率超 50%，为企业研发全流程提效超 30%。

而全新的商汤办公小浣熊2.0，通过结合“日日新”融合大模型强大的原生融合多模态能力，实现赋能更多场景。用户可以借助多模态理解和交互，更好的完成更通用的日常工作，比如文档处理、数据分析等，可以快速实现垂直任务的分析、调研和最终报告生成。

钛媒体AGI了解到，目前，商汤代码小浣熊与办公小浣熊的企业用户超过300家，覆盖众多行业互联网、金融、汽车、制造等，拥有超过100万直接个人用户，以及超过1500万的最终个人用户，日token数高达100亿以上。

大装置业务方面，商汤大装置发布面向开发者的一站式开源Agent应用开发框架——LazyLLM。该框架以数据为核心，支持在应用开发过程中持续迭代数据，从而不断提升数据效果。这一框架可满足国内开发者面向行业和垂域的特定需求，弥补国外工具的不足，同时确保软件自主可控。

同时，商汤还发布万象Agent应用开发平台，是面向企业级大模型应用开发与管理的一站式服务平台，在模型管理平台的基础上，额外具备可视化编排、数据管理、知识库管理、工具管理、Prompt管理等功能，提供数十种控件画布控件和资源控件，支持无限层级的画布嵌套，支持多人协同办公。

依托商汤大装置的万象大模型平台，包括模型管理、微调、开发、调用，以及应用全链路服务，提供完整的企业级原生开发工具链和完善的技术服务能力。模型开发平台与大模型Agent应用开发平台能够助力原生AI应用全流程最优落地。此外，商汤大装置万象平台内置5种以上商汤“日日新”融合大模型体系的自研大模型，以及超过500个高质量预置大模型，包括最新上架DeepSeek系列模型等，推理性能领先业界50%，且大模型平台支持开箱即用，仅需1分钟即可上手。

目前，商汤大装置万象已广泛服务于央国企、运营商、金融、互联网、汽车、泛科技等多个行业客户，以高效的模型精调和推理部署，实现多种业务场景的提质增效（提高质量，增加效率）。

商汤大模型开源开发框架LazyLLM，本质上是类似于LangChain+LLamaIndex的开源AI应用开发者框架。

商汤科技大装置研发总监王志宏对钛媒体AGI表示，2023年大模型发展初期主要集中于模型本身，包括基模型训练和模型微调，但随着技术成熟和市场需求推进，越来越多企业加速 AI 布局，需求也逐步从单个模型变为综合应用。过去一年商汤不断探索 AI 落地关键技术，结合落地经验沉淀出 AI 应用开发框架 LazyLLM，用于加速 AI 应用开发。

王志宏认为，2025 年被视为 AI 应用落地关键节点，金融、医疗等多个行业对 AI 大模型需求持续增长，这些成功案例既验证了 AI 技术落地的可行性，也为各行各业数字化转型提供有力支持。他指出，现在客户数量是越来越多的，客户逐步地从一开始的基模型训练或者模型微调，到现在的直接面向垂直行景场景的一个应用落地。

谈及DeepSeek热潮影响，王志宏表示，商汤第一时间接入了DeepSeek-R1-蒸馏版推理服务，用户通过LazyLLM直接访问DeepSeek 的线上服务，同时团队也把 DeepSeek 相关的思维链蒸馏能力迁移到了LazyLLM上面，持续加大LazyLLM的应用服务体验，逐步在实际应用场景把概念验证（PoC）能力提高到80%-90%。

“LazyLLM本质上它不是一个只做模型训练和推理的平台，而是把我们各种各样的功能工具以及新的大模型把它融合起来，然后通过我的精细化编排做成一个Pipeline（管道）去对外提供应用服务的能力。”王志宏对钛媒体AGI表示。

运用好DeepSeek模型是商汤的一部分技术能力，同时，接下来，商汤还会持续发力日日新大模型。

按照规划，今年3月，商汤集团将公布最新年报，以及基于“1+X”新战略架构的进展；今年4月举行的商汤技术交流日上，有望发布日日新大模型6.0以及一系列的企业级 AI 应用。

当前，AI热潮加速演进，在DeepSeek等公司持续发力下，国内正在加速发展 AI 产业，通过进一步完善开源开放生态系统，加快推动垂直领域规模化应用，持续提升 AI 发展能级和核心竞争力。

工业和信息化部副部长熊继军表示，工信部将坚持创新驱动、应用牵引，为广大开发者营造良好的开发环境，为实现新型工业化提供有力支撑。一是下好创新“先手棋”，提升关键技术创新能力。二是完善开源“生态圈”，构建先进的开源服务体系。三是打造应用“试验场”，加快技术产品落地赋能。四是筑牢人才“蓄水池”，激发全球开发者创新活力。五是融入国际“大舞台”，拓展全球交流合作空间。

（本文首发于钛媒体App，作者｜林志佳）