全球的开发者都来上海了!
今天,全球开发者先锋大会(GDC)在上海正式开幕,这是开年以来上海乃至国内最为盛大的技术盛会之一,吸引了全球逾百个开发者社区参与,可谓是AI界的一场“超级大派对”。
全球开发者先锋大会源自世界人工智能大会(WAIC),截至今年已成功举办三届。大会围绕着“人工智能+”产业生态,服务于全球的开发者。
大会上汇聚了来自AI产业链上下游的各大主体,既有像商汤、阶跃星辰这样的基础模型企业,也有专注于提供语料、算力、垂类模型、工具等细分领域企业,更有诸多投资机构的参与。
全球开发者先锋大会围绕着在线新经济、具身智能、自动驾驶、科学智能、智能终端等五大应用领域开展活动,推动基础大模型与金融、医疗、教育、制造、文旅、城市治理等行业的供需对接。除了今天上午的开幕式之外,还会有大量企业讲坛与开发者活动陆续举办。
本次大会的定位是“社区的社区”,Hugging Face、Linux社区、CSDN 社区、阿里魔搭社区、微软开发者社区等国内外知名开发者社区悉数参会,俨然成为全球科技领域的重要行业盛会。
一、多模态AI赛道开卷,具身智能迎来爆发
本届大会上,多模态AI成为了一大趋势。通过整合文本、图像、音频等多模态数据,AI模型能拥有对复杂环境的理解和生成能力,不仅仅能理解语言,还能理解现实世界中广泛存在的多模态信息。
这不仅推动了AI在更多领域的应用,如自动驾驶、智能零售等,更是通往世界模型的必经之路,有望加速通用人工智能(AGI)的实现。
本届大会上参展、承办活动的各家AI企业,也都在近期于多模态AI这一前沿方向做出了最新成果。
阶跃星辰开年以来在多模态AI领域持续发力。1月,阶跃星辰推出了涵盖语言、语音、图像和视频生成等领域的6款多模态大模型,还在2月开源了2款多模态大模型,包括全球参数量最大(300亿)的开源文生视频模型Step-Video-T2V。
商汤科技在大会上推出小浣熊2.0与LazyLLM开源Agent开发框架。其中,小浣熊2.0 是基于“日日新”融合大模型开发的智能工具,能完成跨文件的多任务代码修改和开发操作,覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、编程学习等各类需求。
MiniMax稀宇科技举办讲坛,探讨多模态大模型开源技术的最新发展及其在各行业的应用落地。其旗下视频生成产品海螺AI全球爆火,支持400万tokens上下文的MiniMax-Text-01模型更在全球开源发布。
上海人工智能实验室则在今年2月份联合南京大学、中科院深圳先进技术研究院,共同开源了视频多模态大模型书生InternVideo2.5,记忆力较前代模型扩容六倍,具备万帧长视频中精准的大海捞针能力。
在大会的互动区,出门问问还带来了多款AIGC工具,其中包括AI配音助理魔音工坊、AI数字分身奇妙元、AI短视频生成平台元创岛等。
这些进展不仅推动了多模态AI技术的普及,也为全球开发者提供了强大的工具,加速了AI在智能汽车、影视创作等领域的应用落地。
本届全球开发者先锋大会上的另一重要趋势便是具身智能。大会现场,宇树、特斯拉、智元、星海图、开普勒、中电科21所、钛虎、云深处、智元新创、创新中心、无锡巨蟹、傲意等一众人形机器人厂商悉数到位。
刚刚在春晚舞台上大放异彩的宇树人形机器人再次成为焦点,上演了机器人遛机器狗的超现实画面。
▲宇树机器人遛机器狗(图源:中国新闻社)
来自加速进化的人形机器人则进行了一场别开生面的球赛。
这些机器人不仅拥有类人的外观和行动能力,也开始逐渐具备对世界的理解、认知能力,这是机器人进化为具身智能的重要一步。
具身智能源自于认知科学中的具身认知理论,这一理论认为,智能不仅仅是大脑的功能,也需要通过身体与环境的互动逐渐培养。同样的,人工智能系统需要通过与环境的交互获取信息、理解问题、做出决策并实现行动,才能产生真正的智能行为和适应性。
随着AI、机器学习、计算机视觉等关键技术的突破,具身智能迎来了极大的发展机遇,使得机器人能够更好地适应复杂多变的环境和任务,具备自主学习能力、感知能力、决策能力。
除了上述两大重要趋势之外,全球开发者先锋大会的活动还覆盖了在线新经济、自动驾驶、智能终端等应用场景,全面覆盖了当下科技行业的前沿进展与落地案例。
在今天上午的开幕式上,有不少“AI+场景”、“AI+服务”的项目签约。AI+金融方面,商汤科技与太平洋保险签约,此举正值上海市推进“AI+金融”的实践,有望发挥AI在支付、保险、银行等金融场景中的优势。AI+医疗方面,卫宁健康分享AI在医疗应用场景的落地,发布WiNGPT医疗大模型最新版本,发布国内首台内置大模型的医疗核心应用一体机等产品。
二、全球开发者先锋大会,要成为“社区的社区”
据大会主办方上海市人工智能行业协会秘书长钟俊浩介绍,与世界人工智能大会不同,GDC大会更注重开发者群体的交流与合作。多个全球知名开发者社区参与了本届大会,包括Linux社区、CSDN社区、阿里魔搭社区、微软开发者社区、AWSUG社区等。
在他们看来,开发者大会的定位不仅限于AI领域,随着技术的成熟,开发者的群体也在不断扩大。现在的开发者不仅仅是代码编写者,还包括AIGC(人工智能生成内容)开发者、硬件开发者等。比如,有人用AI技术作画、生成文字,也有人开发人形机器人或智能穿戴设备。
DeepSeek掀起的开源浪潮,也让开源AI成为这届大会上绕不开的话题。香港科技大学校董会主席、美国国家工程院外籍院士沈向洋便谈道,开源促进了大模型时代的合作,中国团队正积极参与当下的开源潮流。
大会上,开源的机器学习平台和社区Hugging Face会举办编程机器人Seeed具身智能黑客松,全球最大的开源软件基金会——Apache基金会全球副总裁Justin McLean也作为嘉宾出席并演讲,还有众多开发者社区会组织分享最新的开源技术和应用案例。
上海市人工智能行业协会秘书长钟俊浩认为,开源不仅仅是一种商业策略,更是一种文化、一种精神,如何促进开源开放的这种精神,促进全球AI产业的平权,是这一次大会中的核心要点之一。
对开发者而言,开源降低了技术门槛和成本,提供了丰富的工具和资源,加速了创新与协作。
对行业整体发展而言,开源推动了AI技术的普及,打破了技术垄断,促进了透明度和信任。同时,开源加速了AI在各行业的应用落地,构建了更广泛的生态,并推动了安全、伦理等方面的的讨论。
本届大会还见证了全球科学智能开发者社区的启动。这一社区旨在推动AI在科学研究中的广泛应用,将聚集全球顶尖的科学家和开发者,共同探索AI在科学智能领域的潜力,研究机构、顶尖高校及AI企业作为代表出席,形成产学研用的协同创新。
三、帮开发者找一切,给产业链铸基座
本次GDC大会的口号为“开发者,找找找”。通过“找场景,找大咖,找融资,找技术,找工作,找项目,找伙伴”等一系列的活动,让项目找到资本,让场景找到服务,让企业找到市场,让人才找到雇主,让开发者找到技术,让年轻人找到伙伴,促进开发者们资源对接,产业融合。
聚焦大模型、算力、语料、工具、软件平台等核心技术,大会参与的开发者群体来自硬件开发、云计算、大数据、物联网、AI、机器人、区块链和元宇宙等多个领域,开发者活动将为这些来自不同行业的开发者创造交集,相关活动包括沉浸式互动体验、开发者工作坊、GDC Talk开放麦、路演大舞台Demo Day、竞技场赛事等。
本届大会还会用真金白银帮助开发者们将自己的想法变成现实。投资机构一直是全球开发者先锋大会上的常客,去年,共有100余家知名投资机构参会,超200个项目参加路演,初创企业融资金额超10亿元。今年,上海国投、徐汇资本、中金资本、孚腾资本、中科创星等实力雄厚的投资机构将会参与路演。
此外,本次大会上将有100亿以上的项目场景,面向开发者群体和企业进行招投标,有望创造更多的项目机遇,可谓是诚意满满。
资金之外,高质量数据将会持续推动AI发展,因此,本届大会也将见证上海市人工智能行业协会数据语料工作委员会的成立。
钟俊浩认为,高质量的语料变得越来越重要。目前,互联网上的数据只占人类可见数据的20%左右,更多的数据存在于图书馆、工厂档案室、教育文档等地方。如何从这些数据中提取高质量的语料,是未来AI竞争的关键。
这一委员会由上海AI语料数据平台企业库帕思科技和上海市人工智能协会推动成立,大会上也将探讨如何从现有数据中提取语料,以及如何通过合成数据提升大模型的能力。
大会在构建开发者网络、促进资源对接、保障语料、算力等AI核心生产资料方面的努力,有望给AI行业打造坚实的发展基座,并辐射整个科技产业。
结语:全球开发者先锋大会加速AI开源、产业化进程
本届大会不仅是全球开发者群体的盛会,更突破传统技术会议的局限,成为集技术探索、职业发展、创新激发与全球合作于一体的多维平台,为开发者和AI行业注入全新活力与无限可能。
从产业视角看,大会展现了AI技术的前沿创新,促进开源生态建设与产业化进程,也推动了全球合作与交流,成为AI行业发展的关键加速器。