在知名咨询公司Gartner提出的技术成熟度曲线中,一项新技术或某种创新面世初期,常常会因过度渲染以致期望值不断膨胀,直至泡沫破裂。2024年8月,人形工作机器人被Gartner评为处于技术成熟度曲线的萌芽期。但近日来,外界对人形机器人技术的期望值显然在加速膨胀。

人形机器人产品密集发布,资本市场数次因相关概念而躁动,媒体对人形机器人的报道热情尚未停歇⋯⋯然而,在热度之下,一个有些“冰冷”的问题始终存在——对于一个尚在持续发展的技术而言,这种热情是否会带来泡沫?而当泡沫破裂,人形机器人行业又当何去何从?

京城机电旗下配天机器人CTO郭涛在接受《每日经济新闻》记者专访时直言,行业整体的发展需要“泡沫”,不然将永远“无人知晓”,但行业发展最终所需要的是,通过一点点啃硬骨头,推动技术发展达到落地应用。从应用角度出发,郭涛认为,具身人工智能目前尚不具备完全泛化能力,在人形机器人赛道再度沸腾之际,他选择将目光投向更现实的“战场”。


配天机器人CTO郭涛 图片来源:受访者供图

“完全泛化”无解?通用具身智能面临“三角制约”

人形机器人接近于人的外观让人们期待它们能够真的像人类一样解决通用泛化问题,但这一畅想的背后可能面临一个“既要、又要、还要”的问题:一个通用具身智能意味着具备庞大的训练数据、优秀的模型性能以及足够的泛化能力,才能真正自主应对现实场景的复杂任务与各种变化。

但,这可能吗?配天机器人认为具身智能发展中存在“三角制约”,即任务自主性、任务复杂度、变化适应性等三大能力要求难以兼顾。

例如,传统工业机器人无需人工介入,也可以处理复杂任务,但需针对特定环境与特定任务;自主移动机器人有较强的自主能力与变化适应能力,但只能处理搬运、清扫、检测等简单任务;遥操作类机器人能在多种复杂环境下执行复杂任务,但需要专业人员全程手动操作。

市场对人形机器人与通用具身智能的兴奋,在很大程度上源于AI(人工智能)大模型所带来的应用想象,当人工智能与机器人技术结合,大模型将赋予机器人更高的智能水平与适应能力,以及更流畅的交互体验。然而,靠大语言模型足以击破具身智能的“三角制约”吗?

郭涛提醒道,大语言模型与通用具身智能对变化适应性的要求截然不同。郭涛举了个例子——让人形机器人洗盘子,机体可能要应对水温变化、洗洁精不够用等各种环境与任务的动态变化,但对大语言模型来说,在用户发布任务后,模型响应外部环境变化的能力变得非常薄弱。


配天机器人产品 图片来源:受访者供图

此外,相比于大语言模型,通用具身智能的训练数据也要少得多。

郭涛表示,大语言模型动辄便需要万亿级tokens(词元)的数据进行训练,而全世界的互联网用户通过聊天、发图片或者视频,都是在为大语言模型自发贡献数据量,但没有人自发贡献机器人的行为数据。尤其在工业领域,数据是私有的而非公开的,要获取这类数据首先要获取工业用户的信任。

如何解决泛化能力与商业价值的矛盾是具身人工智能从技术展示走向商业落地的关键。郭涛认为,在缺乏训练数据还要追求模型高性能的前提下,“现阶段不可能出现泛化的具身人工智能”,但这并不意味着具身智能不是正确的方向。在人形机器人赛道再度沸腾之际,郭涛将目光投向更现实的“战场”,“完全的泛化没戏,但我们可以通过局部泛化,现阶段就能实现商业化落地”,而这也是配天机器人一直以来的思路。

工业场景不只大规模生产,传统机器人有“盲区”

如何实现局部泛化?配天机器人在这个领域已有业务实践。

配天机器人是国内最早从事工业机器人研发的企业之一,产品可应用于焊接、打磨抛光、分拣、切割、装配等多种工业场景。但随着业务发展,工业机器人面对的应用场景已从大规模工业生产转向多品种小批量生产,而后者的需求依靠传统的工业机器人难以解决。

传统的工业机器人采取预编程方式,大规模生产模式下,一次性完成设备安装及算法编程后,工业机器人便可针对生产中的某些环节连续运行多年。但还有很多行业并非如此,例如造船业,一些船舶的生产节奏以个位数计,但用到的部件与工艺十分复杂,传统的工业机器人模式需针对条件的变化逐一编程,但这样一来,用机器替代人工的性价比也就大大降低。

除此之外,复杂装配以及柔性物体的操作也是传统工业机器人的应用“盲区”。郭涛总结道:“凡是预编程解决不了的问题,传统的机器人都做不了。”这一业务痛点促使配天机器人必须向具身智能探索。

配天机器人在今年年初提出,加快具身智能项目落地。郭涛强调,公司发展具身智能,现阶段以实现单一任务泛化为目标,因为在工业领域,单一任务泛化即可为客户提供巨大价值。而公司主打的项目落地方向是焊接,这也是目前机器人的第一大应用场景。“不需要啥都能干,我们就专注焊接这一类工艺,但什么都能焊,把这个做起来市场巨大。”

在郭涛看来,发展具身智能是一个逐步蚕食的过程,从具体的场景、具体的工艺入手,一点一点铺大应用领域,“只要工具集建立起来,推进的速度会很快”。同时,也只有先通过具体场景的实践证明,才能逐步获取工业领域客户的信任,进而获得更多工业数据,形成良性循环。

不过,在具身智能点燃的新一轮市场躁动中,除了郭涛主张的渐进式聚焦创新,押注“原生颠覆”的也不在少数。谈及当前行业的热度,郭涛坦言,任何行业都会经历从无人知晓到泡沫式增长、突然下跌再缓慢爬起来的过程。

郭涛指出,相比于大语言模型,具身智能目前不存在相对统一的模型底座和行业共识,因此业内仍在各自领域里“各显神通”。Transformer的出世成为大语言模型突破的起点,那具身智能何时会迎来统一的理论体系?对此,郭涛摇了摇头,但他对此抱有信心:“因为这么多人都在努力,说不定哪天技术奇点就突破了。”

ad1 webp
ad2 webp
ad1 webp
ad2 webp