2月21日-23日,2025 GDC全球开发者先锋大会在上海徐汇举办。大会以“模塑全球 无限可能”为主题,围绕金融、医疗、教育智能制造等各类场景公司,AI开发工具、多模态大模型、企业级服务以及开源生态等多个领域的技术提供商汇聚一堂,探讨大模型产业化和技术前沿的最新方向。
22日GDC开幕式上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋,上海科学智能研究院院长、复旦大学浩清特聘教授漆远,阶跃星辰创始人、CEO姜大昕,商汤科技联合创始人、副总裁杨帆等重要嘉宾,分享和探讨关于 AI 大模型、DeepSeek、开源大模型与Agent(智能体)应用等话题。
而22日下午,AI 公司商汤科技还宣布开源可构建多Agent大模型应用开发框架LazyLLM,商汤大装置上线万象平台,包含模型开发平台与Agent应用开发平台,并已上架DeepSeek系列模型,企业客户和开发者可在商汤大装置万象平台中可获3个月内1000万tokens免费使用权益;大模型应用层面,商汤发布全新代码小浣熊2.0、办公小浣熊2.0,实现从Copilot迈向Agent转变。此外,商汤科技联合创始人、首席科学家王晓刚透露,日日新大模型6.0也将在今年发布。
很显然,进入2025年,AI 智能体应用、开源模型软件将成为一个新的趋势。
开幕式:沈向洋、漆远、姜大昕等人谈开源和智能体展望
过去一年,上海持续加大 AI 产业政策创新力度,推动技术攻关,强化全产业链生态布局。
公开信息显示,2024年,上海市人工智能产业规模超过4500亿元,同比增长超过7%,累计完成60款生成式AI大模型备案。
据《关于人工智能“模塑申城”的实施方案》显示,到2025年底,上海要构筑起一个涵盖算力、语料、模型、应用等层面的世界级人工智能产业生态,打造世界级的高端 AI 产业集群。
随着国产DeepSeek大模型的横空出世引发关注,AI 新场景、新应用不断涌现。作为 AI 大模型和算力产业链公司重要聚集地之一,上海等地可能将更快地进入 AI 周期的创新阶段,促使新的产业形态形成、催生出新的就业场景以及潜在消费增长。
美国国家工程院外籍院士沈向洋(Harry Shum)在发表题为《大模型时代的创新与思考》主旨演讲时,充分肯定了大模型时代开源的力量。
“DeepSeek让大家看到开源社区的胜利。把了不起的模型开源后,让更多人得到机会,在这个模型上做更多了不起的事情。”沈向洋指出,从技术进步的角度看,开源并非新事物,但其蓬勃发展始于互联网的出现后。互联网极大增强了全球合作开源的能力。此外,也可以从商业选择的角度理解开源。
沈向洋认为,纵观2023年到2024年不同公司开发的模型在企业实际使用中的比例,市场份额从高到低的大模型中,开、闭源策略各不相同,与其市场份额没有明显关联。因此他认为,开源和闭源不是对立的商业模式,开源还是全球合作的重要领域,中国是开源研究的受益者,现在也是国际开源社区的贡献者。
沈向洋强调,现在来讲,闭源模型的份额实际上还是远远超过开源份额,但可能接下来这一两年,这件事情的改变会非常的大。任何事情都必然有一个平衡方式,因此,我们需要思考未来。
沈向洋表示,对于大模型,之前的研究焦点是GPT模式,现在的焦点是Reasoner(推理)模式,这是一种新的学习范式。
他指出,此前以OpenAI的GPT系列模型为代表,这是一种“快思考”模式,大模型都是在做预训练拓展,主要原理是预测下一个token,而推理模式则注重任务完成,允许反复试错和修正,更接近人类的“慢思考”。模型会先打草稿,反复试错找到正确路径后,总结过程和答案,训练的是模型慢思考的能力。因此,这种新模式通过逐步抽象化复杂问题并推导解决方案,已在视觉推理等领域得到应用。
对于近期广为讨论的人与机器的相处关系到底应该是AI(Artificial Intelligence,人工智能)还是IA(Intelligence Augmentation,智能增强)?沈向洋指出,智能增强(IA)是指通过技术扩展人类的能力,帮助人们更高效地完成任务,而不是取代人类。
在沈向洋看来,大模型里最难的事情之一,是开源数据,因此,需要开源社区能贡献更多数据,在新的范式里,大家一起有更大的进步。
2025年1月,DeepSeek发布开源的推理模型R1,在强大的推理能力之外,还有高性价比的特性,其复现的训练成本仅为o1的4%,Grok-3的0.2%,推理成本仅为Grok-3的18%,o1-mini的3.7%。尽管DeepSeek团队没有参加GDC开幕式,但DeepSeek已然成为全场的关键词。
“DeepSeek在有限算力下的普惠智能,是开源开放的胜利。”上海科学智能研究院院长、复旦大学浩清特聘教授漆远说,开源将有效加速新技术的渗透率,导致 AI 技术大规模的应用。
根据“杰文斯悖论”,这样的高效低耗将加速新技术采用速度和广度,虽然每个token的推理成本降低,但是普及后有更多人使用,总量反而会上升。如今,DeepSeek仅用数百万美元训练成本、以及仅用7天打破ChatGPT 2个月做到用户数破亿记录,使得这种“杰文斯悖论”得到明显的证实与商业成功。
漆远表示,这意味着,今天每个大模型token的推理成本越来越低,但是更多人使用之后,有可能整体token使用量反而更高,底层上大家在海量使用开源技术。另一方面,大家也可能忽略了信任,开源本身其实可以加强大家对开源的信任,低成本带来一个非常大、背后商业上的成功。
据悉,漆远团队已经研发了燧人物质大横型、伏羲气象大模型等多个技术产品,同时,漆远创立的无限光年公司,致力于研发独特的可信大模型及工具链技术,聚焦“一横一纵”的产品体系和全球化发展战略:一横光语启智是“训推用”一站式智算服务平台,是中国领先的专门面向科学智能的智算平台;一纵 「光语金帆」精准推理大模型及Agent应用,专为金融专业人士打造的智能助手,光语金帆已在招商证券、汇丰银行等头部金融机构落地应用。
漆远指出,我们其实当前低估了大模型带来的未来发展,也许Transformer之后还有新的架构出现,我们讲稀疏架构,一系列新的技术相信会进一步推进人工智能的发展。“土壤、水分、阳光三位一体”之后,将加速科学智能的发展,而如果我们有了开放的生态,对高校、龙头企业、新锐企业可以产生一个非常好的推动作用。
“我们讲Hacker精神本身,Hacker精神本身就是一个开源,是开源开放的胜利,科学智能需要更多元、更开放的合作。第二个价值放大,Token更便宜,其实使用更多是底层技术快速渗透,科学智能价值会发挥更大作用。”漆远称。
阶跃星辰创始人、CEO姜大昕表示,开源以来,公司的产品收到了非常多的关注和好评,全球创作者使用阶跃星辰的模型创作了海量视频。同时,越来越多的伙伴加入了阶跃星辰的开源生态,包括技术社区、创作社区、云厂商、芯片厂商等。3月,阶跃星辰还将继续开源图生视频产品。
沈向洋强调,未来最大的机会,在于人和机器的关系,即人机交互。他倾向于把人机关系定义为“以人为本的人工智能”,并呼吁关注 AI 伦理问题。
“回看过去四、五十年,整个信息社会的发展,整个计算机行业的发展,最重要的一件事,实际上是人如何去使用计算机,哪个公司抓住了人和机器交互的入口,就会成为世界上最伟大的公司。当年PC时代,Windows这样的产品成就了微软,互联网时代搜索陈旧了谷歌,移动时代成就了TikTok,如今 AI 时代,DeepSeek正在驱动中国 AI 领先地位。”沈向洋称,发展人工智能过程当中,一定要牢记“以人为本的 AI”这样以一个思路,关注到 AI 人才、AI对社会等影响。
商汤发力“大模型+大装置”应用,加速构建AGI平台
DeepSeek热潮下,国内 AI 应用发展成为关键课题,在开幕式上,商汤科技联合创始人、副总裁杨帆提到了一个小故事,引发思考。
“说起落地应用选择,其实这也是满困扰我的问题。商汤也做了很多算法、算力和应用,但现在技术发展太快了,我说要不我问一下2024年非常火的一款大模型,我说2025年会有什么关键的重大机遇,它跟我说4条:应用场景拓展、国产算力突破、数据质量提升、国际竞争优势。我问一下DeepSeek,它就跟我说服务器繁忙,请稍后再试。”
杨帆认为,即便 AI 今天很聪明,拥有了更多的智能,但他还是更多在人类的指引下,帮助我们去更好的学习知识、记忆知识,帮助我们更好的回答问题,到底我们怎么样在日常生活中、产业发展实践的挑战中,能够更好的使用 AI 工具、AI助手,这个需要我们不断的思考、探索与回答。
如今,依靠“大模型+大装置”能力,加速构建AGI目标,是商汤科技全新十年的主线,基于大模型的落地应用也进入了加速期。
2月22日全球开发者先锋大会商汤分论坛上,商汤科技公布了全新多Agent大模型应用开发框架LazyLLM、商汤大装置上线万象平台,以及全新代码小浣熊2.0、办公小浣熊2.0,实现从Copilot迈向Agent转变。
商汤小浣熊负责人贾安亚表示,当前AI的突破方向大致可归纳为“多快好省”四个方面,即更多的模态融合、更快的推理速度、更优的思考能力和更低的训练成本,这使得大模型应用落地进入加速期。
贾安亚认为,大模型应用落地的范式主要为副驾驶(Copilot)和智能体(Agent),二者分别代表模型在不同应用场景、不同环节与人协作的不同模式。商汤小浣熊也正好有代码小浣熊和办公小浣熊两个产品,分别为面向个人和企业的编程助手与面向个人和企业的办公助手。
其中,全新的代码小浣熊2.0在原有代码补全、问答交互的基础上,实现了多维度的数据融合和多模态推理等能力,不仅面向C端用户提供更高效、智能的代码编写和开发任务,还面向企业提供从需求分析、测试迭代到代码资产管理的端到端软件开发解决方案。实际应用中,代码小浣熊可帮助开发者提升编程效率超 50%,为企业研发全流程提效超 30%。
而全新的商汤办公小浣熊2.0,通过结合“日日新”融合大模型强大的原生融合多模态能力,实现赋能更多场景。用户可以借助多模态理解和交互,更好的完成更通用的日常工作,比如文档处理、数据分析等,可以快速实现垂直任务的分析、调研和最终报告生成。
钛媒体AGI了解到,目前,商汤代码小浣熊与办公小浣熊的企业用户超过300家,覆盖众多行业互联网、金融、汽车、制造等,拥有超过100万直接个人用户,以及超过1500万的最终个人用户,日token数高达100亿以上。
大装置业务方面,商汤大装置发布面向开发者的一站式开源Agent应用开发框架——LazyLLM。该框架以数据为核心,支持在应用开发过程中持续迭代数据,从而不断提升数据效果。这一框架可满足国内开发者面向行业和垂域的特定需求,弥补国外工具的不足,同时确保软件自主可控。
同时,商汤还发布万象Agent应用开发平台,是面向企业级大模型应用开发与管理的一站式服务平台,在模型管理平台的基础上,额外具备可视化编排、数据管理、知识库管理、工具管理、Prompt管理等功能,提供数十种控件画布控件和资源控件,支持无限层级的画布嵌套,支持多人协同办公。
依托商汤大装置的万象大模型平台,包括模型管理、微调、开发、调用,以及应用全链路服务,提供完整的企业级原生开发工具链和完善的技术服务能力。模型开发平台与大模型Agent应用开发平台能够助力原生AI应用全流程最优落地。此外,商汤大装置万象平台内置5种以上商汤“日日新”融合大模型体系的自研大模型,以及超过500个高质量预置大模型,包括最新上架DeepSeek系列模型等,推理性能领先业界50%,且大模型平台支持开箱即用,仅需1分钟即可上手。
目前,商汤大装置万象已广泛服务于央国企、运营商、金融、互联网、汽车、泛科技等多个行业客户,以高效的模型精调和推理部署,实现多种业务场景的提质增效(提高质量,增加效率)。
商汤大模型开源开发框架LazyLLM,本质上是类似于LangChain+LLamaIndex的开源AI应用开发者框架。
商汤科技大装置研发总监王志宏对钛媒体AGI表示,2023年大模型发展初期主要集中于模型本身,包括基模型训练和模型微调,但随着技术成熟和市场需求推进,越来越多企业加速 AI 布局,需求也逐步从单个模型变为综合应用。过去一年商汤不断探索 AI 落地关键技术,结合落地经验沉淀出 AI 应用开发框架 LazyLLM,用于加速 AI 应用开发。
王志宏认为,2025 年被视为 AI 应用落地关键节点,金融、医疗等多个行业对 AI 大模型需求持续增长,这些成功案例既验证了 AI 技术落地的可行性,也为各行各业数字化转型提供有力支持。他指出,现在客户数量是越来越多的,客户逐步地从一开始的基模型训练或者模型微调,到现在的直接面向垂直行景场景的一个应用落地。
谈及DeepSeek热潮影响,王志宏表示,商汤第一时间接入了DeepSeek-R1-蒸馏版推理服务,用户通过LazyLLM直接访问DeepSeek 的线上服务,同时团队也把 DeepSeek 相关的思维链蒸馏能力迁移到了LazyLLM上面,持续加大LazyLLM的应用服务体验,逐步在实际应用场景把概念验证(PoC)能力提高到80%-90%。
“LazyLLM本质上它不是一个只做模型训练和推理的平台,而是把我们各种各样的功能工具以及新的大模型把它融合起来,然后通过我的精细化编排做成一个Pipeline(管道)去对外提供应用服务的能力。”王志宏对钛媒体AGI表示。
运用好DeepSeek模型是商汤的一部分技术能力,同时,接下来,商汤还会持续发力日日新大模型。
按照规划,今年3月,商汤集团将公布最新年报,以及基于“1+X”新战略架构的进展;今年4月举行的商汤技术交流日上,有望发布日日新大模型6.0以及一系列的企业级 AI 应用。
当前,AI热潮加速演进,在DeepSeek等公司持续发力下,国内正在加速发展 AI 产业,通过进一步完善开源开放生态系统,加快推动垂直领域规模化应用,持续提升 AI 发展能级和核心竞争力。
工业和信息化部副部长熊继军表示,工信部将坚持创新驱动、应用牵引,为广大开发者营造良好的开发环境,为实现新型工业化提供有力支撑。一是下好创新“先手棋”,提升关键技术创新能力。二是完善开源“生态圈”,构建先进的开源服务体系。三是打造应用“试验场”,加快技术产品落地赋能。四是筑牢人才“蓄水池”,激发全球开发者创新活力。五是融入国际“大舞台”,拓展全球交流合作空间。
(本文首发于钛媒体App,作者|林志佳)