智东西(公众号:zhidxcom)
作者云鹏
编辑漠影
随口说上一句话,机器人就可以为你倒一杯果汁、打一个鸡蛋、将桌子上的碗筷准确放到收纳架上,机器人还可以读懂你的喜怒哀乐,颇具幽默感地给你讲个小笑话。
今天,这些颇具科幻感的场景已经成为各路科技巨头发布机器人新品时的常见演示,AI大模型让AI可以更好地看懂世界、理解世界并与人和世界产生更好的交互。
在大模型能力的快速迭代下,具身智能已经成为当下机器人赛道聚光灯下的焦点,国内资本市场火爆,各路创企涌入,巨头们也纷纷行动,电影中的大管家“贾维斯”,似乎正在向我们招手。
但相比发布会上的“仰望星空”,机器人赛道显然需要更多的脚踏实地,如何让机器人能够在更多场景中落地、实实在在地去服务企业和消费者、解决需求痛点,是更为实际的问题。
服务机器人市场作为机器人领域商用较为成熟的领域,正在具身智能的发展下涌现出新的变量。
近日,有着丰富产品矩阵与落地场景的全球服务器机器人巨头擎朗智能,再度发布了一系列新品,并亮出了基于自身海量真实场景数据打造的具身多模态模型。
其人形具身服务机器人新品XMAN-R1,基于“岗位化、亲和力、安全性”理念设计,已经具备了在服务行业中处理长程任务的理解规划能力,成为业内关注的焦点。
▲XMAN-R1
擎朗自研的多模态模型正在帮助服务机器人一步步脚踏实地走向场景,解决更加复杂动态化的任务,具身智能核心的泛化能力得到大幅提升。
其实早在去年的WAIC世界机器人大会上,擎朗就已经推出了XMAN-W3这样的产品,在酒店机器人基础上增加了灵活的双臂,这也是擎朗在具身智能领域的前瞻探索,这款可爱的XMAN-W3与XMAN-R1属于同门同系师兄弟。
▲XMAN-W3
可以说,在具身智能商业化落地方面,擎朗一直跑在前面。
毫无疑问,当下具身商用服务机器人市场正涌现出巨大机遇,而擎朗基于自身15年行业积淀,掏出从大模型技术、软硬件工程化/产品化能力到技术商业化验证三张王牌,已经向着具身商用服务机器人的蓝海迈出了一大步。
一、服务机器人规模化加速,泛化能力如何打破数据瓶颈?
根据市研机构IDC预测,未来全球具身智能服务机器人市场将快速增长,五年后的2030年,市场规模或达到939亿美元(约合人民币6819亿元),复合增长率达到86.2%。
具身智能涌现出的巨大增长潜力,给商用服务机器人赛道的玩家们带来了巨大动力,同时也带来了新的挑战。
近年来,服务机器人在餐饮配送、商用清洁、银行导览、酒店服务等领域已经形成规模化落地,在商超、文娱、医疗、康养等细分领域也展现出强劲的增长潜力。
与此同时,机器人面对的场景越来越复杂、非结构化,比如餐厅、医院等场景充满不确定性,突发情况较多、光线也十分复杂,人类可以依靠经验快速调整,而传统机器人则需依赖预编程规则与强化学习,效率低且难以覆盖长尾场景。
具身智能的核心在于“智能体通过身体与环境的互动来学习”,正是当下行业痛点的良好解法,而这一过程也天然需要泛化能力。
服务行业需要有泛化能力的具身智能机器人,需要具身智能机器人“更聪明更懂人”,克服动态非结构化复杂环境、人与机器的高频交互博弈、全流程闭环这三大挑战,更好地解决实际生活中的问题。
但当前具身智能的泛化面临瓶颈。相对于多模态大模型可以利用互联网文字、图像、视频、音频等数据进行训练,具身智能大模型目前依然缺少可用于训练的高质量、大规模人类操作数据。
正如擎朗CEO李通所说,对于具身智能的发展来说,这是一个“先有鸡还是先有蛋”的问题。
具体来讲,具身智能的数据来源包含遥操作采集(通过手柄、体感设备等遥控机器人完成任务来采集数据)、生产伴随采集(在真实环境中,人类操作员通过穿戴外骨骼等设备,在实际生产中采集数据)、仿真数据合成(在高仿真3D环境中,实现机器人的数据采集)三个主要途径。
根据不同的场景任务,综合三种采集方式,可以显著提高具身智能体模型训练效果,快速实现模型能力落地。
所以相比“一口吃个胖子”,放个吸睛感十足的“大招”,擎朗选择了更脚踏实地真正可行的一条路,优先实现局部泛化。
在擎朗看来,现阶段直接实现完全泛化的具身智能是几乎不可能的,但通过单一任务泛化实现商业落地是可行的,让机器人先专注于特定岗位场景,再逐步扩展其他岗位场景,最终融会贯通。
二、软硬件自研技术齐头并进,擎朗具身服务机器人打出三张关键王牌
在这样的理念加持下,擎朗在具身智能风口找到了自己的准确方向,并率先交出了答卷,此次XMAN-R1的发布以及自研垂类多模态大模型的深度融合,为擎朗在具身智能服务机器人赛道按下了加速键。
具体到XMAN-R1,其核心的设计理念是岗位化、亲和力、安全性。这三方面的关键特性可以说是具身智能服务机器人落地的关键抓手。
在岗位化方面,XMAN-R1可以模拟岗位化姿态或岗位化行为模式,简单来说,就是机器人可以学习人类服务人员的动作逻辑。
值得一提的是,“机器人岗位化”的概念是由擎朗首次提出的,直观理解,就是将服务场景解构为标准化岗位单元,再将机器人定位为标准化的“岗位员工”。
比如一个机器人专门就负责快餐店的汉堡制作,一个机器人可以专门负责炸薯条的制作,而另一个负责打包收款结账。
每一项工作内容都可以被精确描述,结果可以被标准化评估,这无疑更利于在商业环境形成机器人能力的闭环。
与此同时,通过不断的复制“岗位化”工作模式,擎朗的人形具身服务机器人可以不断学习和拓展多样化工作能力,并持续迭代基础动作模型能力,从而实现更广泛的落地场景应用。
在另一个关键特性安全方面,XMAN-R1也可以说是黑科技武装到牙齿。
其搭载了摄像头、激光雷达、深度相机等种类丰富的传感器,在算法层面则采用了擎朗自研的实时空间三维重建技术。
各项技术加持下,机器人具备了很强的环境感知能力,能实时对环境中的静、动态障碍物进行准确识别和未来行为预测,并通过云端大脑对复杂任务进行多级规划,最后结合本地小脑进行自适应运动控制,保障机器人的拟人化动作逻辑。
感控一体的全身运动规划模型,可以在开放式复杂环境中确保人机协作和周边人群安全。
这种云端“大脑”任务理解+本地“小脑”运动规划与控制的模式可以很好地兼顾性能、效率、功耗、成本等多方面因素。
在这背后,擎朗长期积累的海量开放场景语义数据和擎朗具身多模态模型的实时决策能力都发挥着关键作用。
在避障算法领域,擎朗同样有着深厚积累,截至2025年,擎朗智能在避障领域已申请165件发明专利,据查询,在服务机器人领域的授权发明专利数量上,擎朗在中国服务机器人行业居首位。
此外,在各类传感器原始数据处理、平衡性能与精度、降低时延、降低功耗等方面,擎朗也实现了诸多软硬件技术层面的创新。
最后,在亲和力方面,这次XMAN-R1的外观更模拟人体比例,富有亲和力的设计可以让它更好地融入商业环境中,机身流畅精炼的线条可以兼顾科技感与力量感。
在这三大特性之外,擎朗自身服务机器人生态在协同性方面也涌现出巨大潜力。
在擎朗看来,人形具身服务机器人不是对现有产品的替代,而是对现有机器人生态的完善和升维,去解决服务行业的最后一环任务难题。人形具身服务机器人会与专用型具身服务机器人实行岗位化分工,融入整个擎朗的机器人服务生态。
从餐饮领域的配送机器人T10、酒店场景的服务机器人W3到清洁机器人C30、医疗领域的X101和工业领域的S100,人形具身服务机器人XMAN-R1将成为擎朗服务机器人生态矩阵的关键一环。
人形具身服务机器人具备较强的通用性和适应性,能够执行复杂、非结构化的任务,可以与在特定任务上具备高效率和高精度的专用机器人形成很好地“互补”。
比如在餐厅中,XMAN-R1可以独立完成取酒倒酒、放置托盘等配餐动作,并通过机器间任务调度,将餐品交接给配送机器人T10,后者会按最优路径送餐,最终完成服务闭环。
可以说,通用具身服务机器人与专用具身服务机器人的协同必然会是未来智能机器人发展的重要方向之一,两者的结合可以充分发挥各自的优势,更高效、更灵活执行任务。
总体来看,从机器人的内在到外在,从各类自研软硬件技术到机器人生态协同,从岗位化专用做到极致到泛用性的高效迭代,在具身服务机器人该怎么做这件事上,擎朗已经趟出了一条切实可行的新路子。
三、每天数亿条数据、数千万次人机交互背后,具身智能商业化落地加速
面对具身智能的火爆,所有机器人企业都面临着新的机遇和挑战。行业到底会如何发展?企业要如何抓住需求、快速迭代产品技术、拓展市场?
在擎朗看来,具身智能的发展必然要先做好“专用”这一环,这也是具身服务机器人商业化落地的最佳路径。
李通提到,通用人形机器人的未来是非常光明的,擎朗也非常认同这一方向,但当下数据不足已经成为行业的核心痛点。
只有先通过专用机器人创造场景入口,积累数据反哺技术,才能进一步迭代使得具身智能可以拓展边界,进而拉动更多专用设备部署,形成良性的商业闭环。
从行业视角来看,擎朗的做法显然有极高的参考价值,在各个领域打造一群“专家机器人”,通过高度岗位化的场景海量获取高质量数据,快速迭代模型和算法,不断提升机器人的泛化能力。
最终,当无数细分领域的专家机器人的能力被汇聚起来,真正泛用、通用的人形具身智能机器人,也就离我们不远了。
未来,真正的“大管家”具身服务机器人,也许会由一个通用大模型作为大脑,而各类来自于各领域“专家”的优秀小模型则会让机器人在处理各类任务时都能游刃有余、专业高效。
在与擎朗CEO李通的深入交流中我们感受到,擎朗对于通用具身智能未来的发展是积极乐观的。
从创业之初,擎朗就一直希望做能够服务好企业和消费者的服务型机器人,在这条路上,不断有新的技术涌现,从深度学习强化学习到如今的AI大模型、具身智能,新的技术都会成为擎朗优化机器人体验的利器。
在过去的15年里,擎朗完成了专用服务机器人的产业化和商业化普及,成为全球最大的商用服务机器人企业。
▲擎朗智能机器人生态矩阵
从餐饮、酒店到医院等场景,擎朗累计部署了超过10万台配送、清洁等专用机器人,服务网络已经覆盖了60多个国家和地区。
这样深厚的积累,正是擎朗可以在具身智能浪潮中快速跑在行业前列,能做好具身服务机器人的突出优势之一。
十几年的服务机器人行业经验,让擎朗积累了海量的服务场景数据,涵盖餐饮、酒店、医疗、工业等场景。这些数据对于擎朗具身多模态模型的能力提升有着极大的促进作用。
通过各个场景的视觉、语音等多模态数据的训练,使得擎朗的多模态大模型具有优秀的场景感知与任务理解能力,这正是其它机器人企业所不具备的。
正如李通所说,机器人不仅是效率工具,更是数据入口——擎朗智能每天产生超数亿条环境感知数据、数千万次人机交互记录,拥有全球最大的商用机器人场景数据源。
“专用机器人的价值不仅是完成任务,更是为通用化提供数据。”
与此同时,十余年来,擎朗对商业服务场景中的客户需求、场景特点、交互方式等非常熟悉,擎朗会花大量的时间去了解客户的整个流程的操作细节。
展望未来,AI大模型赋能继续加速、多模态感知技术加速迭代,具身服务机器人加速走向“通用泛化”,机器人会通过模块化技能库组合应对新任务,会像人类婴儿一样,通过感知运动经验自主构建物理规律认知。
而已经实现全场景渗透、全品类布局、全球化拓展,掌握技术、市场和模式多重优势的擎朗,已经成为撕开万亿蓝海市场的核心推手。
结语:服务机器人赛道掀起具身智能浪潮,擎朗提前交卷
海量真实场景数据而来的具身多模态模型、软硬件工程化/产品化能力、充足的技术商业化验证,这三个关键优势已经成为擎朗在具身智能时代的最硬底牌。
此外,擎朗智能保持着开放生态与尖端设计的能力,如今擎朗机器人已完成市面上多款热门AI大模型的接入,并实现应用场景的成功落地;旗下机器人产品频频斩获德国红点奖、德国IF设计奖等世界级顶尖奖项。
当下商用服务机器人市场正处于技术革新的关键年,国产化替代加速、覆盖场景加速扩展,具身智能必将成为全球商用服务机器人的核心角逐焦点,AI将给服务机器人赛道带来哪些新的变量,又有哪些产品将惊艳登场,我们拭目以待。