3月20日,2025年中国家电及消费电子博览会(AWE2025)上,实时互动云服务商声网推出了对话式 AI 开发套件,并宣布该套件软硬件全面开源。

据声网官方介绍,对话式AI开发套件基于博通集成(Beken)高性能AI芯片BK7258,结合声网深度优化的对话式AI引擎,构建了完整的端侧实时交互系统,可为开发者提供「对话式AI+智能硬件开发」一站式解决方案。


(图源:声网)

在语音活动检测(VAD)、实时语音混合、智能打断处理等技术和方案的加持下,声网对话式AI开发套件具备五大优势。

第一,AI对话体验堪比真人交互。声网对话式AI开发套件可实现AI与用户对话延迟低至650ms,打断响应低至340ms,接近真人聊天对话,再加上精准的语音识别能力,即便在复杂环境下也能准确获取用户指令。

第二,对于多模态交互的支持。声网对话式AI开发套件不仅提供丰富的接口支持,还支持文本、视频、触控等多种交互方式,打造出了集听、说、看、触于一体的交互形态,可满足开发者和用户的多样化需求。

第三,兼容主流AI大模型。在开源成为主流的今天,开发者已不需要付出高昂成本自研AI大模型,接入其他企业开发的AI大模型更加省时省力。声网对话式AI开发套件兼容通义千问、豆包、DeepSeek等国内常见AI大模型,也可以接入开发者自研大模型,选择更加丰富自由。

第四,可帮助开发者缩短产品开发周期。声网表示,AI开发套件软硬件全面开源,开发者仅需下载开源代码,就能将AI能力集成到自己的硬件设备中,1小时即可跑通Demo,1天完成产品原型送样,从而大幅缩短产品的开发周期,降低产品开发成本。


(图源:声网)

第五,极低的功耗。声网对话式AI开发套件采用低功耗设计方案,可实现超长待机,解决移动便携类产品的续航焦虑,扩大适用范围。

至于使用场景方面,声网提到了AI玩具、AI教育硬件、AI陪伴设备、家庭语音助手、穿戴设备-个人助手等领域。其中AI玩具、AI陪伴设备主打陪伴功能,今年的CES、AWE大会均有许多企业展出了陪伴机器人,可见该行业前景巨大,部分企业已抢先入场。

AI教育硬件、家庭语音助手、穿戴设备-个人助手则围绕生活和工作,通过更准确的语音识别和更智能的人机交互,提高生活便捷度与工作效率。

在这些品类中,AI玩具可能是声网快速发挥作用的主战场。声网透露,2024年全球AI玩具市场规模已达181亿美元,预计2033年市场规模将达到600亿美元。AI情感陪伴机器人初创公司珞博Robopoet此前发布的口袋AI毛绒宠物Fuzzoo,便搭载了声网的对话式AI技术,能够为用户提供个性化交互体验。


(图源:声网)

随着相关供应链的成熟,具身智能正逐步走入我们的生活,但无论是机器人,还是配备了各类传感器的家电设备,提高实用价值的关键就在于可以准确接收用户的语音指令,并通过AI大模型解析和执行任务。

声网对话式AI开发套件软硬件全面开源,意味着有志于具身智能行业的企业,能够低成本、快速为产品加入AI对话能力。该产品可自由接入传感器和大模型的特性,为开发者提供了极高自由度,可以基于声网提供的平台,快速适配自家的硬件设备。

在声网对话式AI开发套件全面开源,有望为国内整个具身智能行业进一步提速,AI玩具、AI教育硬件、AI陪伴设备等品类,或将快速成熟并落地量产。

ad1 webp
ad2 webp
ad1 webp
ad2 webp