一款极其灵动的 AI 台灯机器人,火了。
尽管这两年不断见证了真实世界的机器人刷新我们的认知,从奔跑、翻滚到跳舞,也看过了米家皮皮灯,但还是第一次看到这么灵动的——台灯,很像皮克斯片头跳动的 Luxo Jr.(小台灯)。
图/苹果
而这个台灯,是苹果公司机器学习研究团队做的非人形机器人。
苹果要做家用机器人的消息,其实已经传了相当一段时间,但官方实际上一直没有承认,也没有透露产品细节。不过,苹果机器学习研究团队近期直接在官网公布了一篇研究论文以及一段实拍演示视频,全面展示了这款 AI 台灯机器人的交互能力和表现,也在 X、Reddit 等社交平台上被各种围观讨论。
乍看之下,这款苹果「台灯」的外观并不奇特,硬要说也就是比常规台灯全身上下多了不少机电结构。但关键是动起来,它不仅能让灯光主动跟随书本,用户还能通过简单地触摸、手势来召唤或者指引它。
图/苹果
不仅如此,苹果「台灯」还能通过流畅、精细的动作传达出微妙的性格与情绪,比如被拒绝后的委屈,被召唤时的点头哈腰,又或者是观察一个物体时的好奇心。
而且从演示来看,不只是提供情绪价值。苹果的「台灯」除了支持语音和手势交互,同时还能通过摄像头进行视觉观察,以及透过投影显示内容,就比如做作业时遇到不懂可以让它给出解题思路。
图/苹果
尽管这还只是一个原型产品,但也足以让我们一窥苹果对于家用机器人的想法和思考。
苹果 AI 台灯:智能,但不止于实用
坦白讲,整个演示视频看下来,苹果机器学习研究团队开发的这款台灯机器人,对小雷来说最亮眼的还是智能程度和交互表现。
演示中的一幕是,苹果「台灯」不仅能提醒研究人员喝水,还会直接主动用头部将水杯推向她:
图/苹果
一方面,类似主动提醒用户的想法其实早已有之,不管是手机、PC 上的各种软件,还是雷科技年前报道过的 ChatGPTTasks 功能,但这些做法只停留在数字世界,做不到在物理世界的主动提醒。
另一方面,AI 台灯机器人的想法也不稀奇。米家的皮皮灯也引起过大家的激烈讨论,但最后基本被认定为一个可动性、可玩性都不太高的玩具。字节跳动也尝试过这个方向,推出过大力智能作业灯,也是将 AI 集成进台灯的概念,但交互上基本停留在软件上。
米家皮皮灯,图/小米
而苹果「台灯」上,我们能看到询问天气时不仅是语音播报天气,还会转向户外,透过摄像头的 AI 视觉能力结合当前现实空间看到的天气。有意思的是,当研究人员告诉它不能带它去徒步时,「台灯」也会低下头扭捏,传达出悲伤又委屈的情绪。
图/苹果
当你正在进行手工作业或者任何桌面上的研究时,也能让「台灯」时刻并提供建议,甚至是把需要内容直接投影出来;晚上看完书后,「台灯」在识别没有其他活动后也会自动关闭灯光。
甚至当它伸长身体也无法完成任务时,也是会在尽力尝试后「委屈地」告诉你做不到。看到这样,你还能抱怨它吗?属实是情绪价值拉满。
图/苹果
一言以蔽之,实用价值要有,情绪价值也要有。而这,也能从苹果团队的字里行间中清晰地看到:
「为了使机器人与人类更自然地互动,机器人的运动设计也应同样整合表达性品质——如意图、注意力和情感——以及传统的功能性考虑,如任务完成、空间限制和时间效率。」
台灯变身机器人:不只是萌,不只是接入AI
事实上,尽管从对话和智能程度来看,大概率可以判断出苹果机器学习研究团队是基于大模型开发出了这款台灯形态的 AI 机器人。但就苹果公布的这篇论文而言,并非聚焦在人工智能的层面,反而是聚焦在「台灯」一系列精细、灵动的运动上。
首先苹果论文的标题就是——《ELEGNT: Expressive and Functional Movement Design for Non-anthropomorphic Robot》(优雅:非人形机器人的表现性和功能性运动设计),四位论文作者中有三位是华人。
论文也透露了,台灯形态的灵感确实直接来源于皮克斯的经典角色 Luxo Jr.(小台灯) ,而苹果也针对台灯形态的非人形机器人设计出了一套框架,专注于通过一系列流畅且富有表现力的动作,在日常互动中实现情感表达和实用功能的结合。
简单来说,为了避免生硬的机器人运动/动作影响人类与机器人之间更自然地交互体验,苹果团队开发出了这一套基于深度学习的运动设计框架,来让非人形机器人兼具表现力和功能性。
图/苹果
研究团队也确实招募了 21 名参与者,在 6 种不同场景下观看人类与机器人之间的交互。
结果显示,比起单纯满足功能性要求的运动设计,兼具表现力和功能性的运动设计明显能提高参与者的评分——用户更喜欢也能接受 ,而且男性比女性更明显,普通用户比专业用户更明显。
其实从常理也能看到,米家皮皮灯推出之初之所以能够引起广泛关注和讨论,并不在于功能性或者实用价值。但另一方面,苹果这款 AI 台灯的原型版最大的亮点就是同时具备情绪和实用价值,而不只是「萌」。
图/苹果
苹果很大程度上也是基于大模型的能力,自然语言对话自不必说,从视觉能力上也能得以窥见一二。与此同时,在人形机器人还很难短期内落地家庭场景的背景下,这可能也是家用机器人的必然,即基于多模态大模型成为人类的「第三只眼」「第二大脑」。
此外,这款「台灯」也让我们初步看到了苹果在人机交互上的想法,比如除了 AI 语音交互,还能看到基于摄像头的 AI 视觉+图形界面显示,以及简单的手势和触摸交互。尤其是视觉+显示的交互能力,直接赋予了「台灯」在各种场景下满足的需求。
从这个角度看,我们完全可以期待苹果未来最终推出的桌面机器人,在语音之外也支持视觉和显示的能力,在拥有基于 AI 的实用价值的同时,也能满足人类用户的情绪价值。
距离通用机器人,我们还有很远的路要走
1977 年,乔治·卢卡斯带着《星球大战》一炮而红,也带火了其中的 R2-D2 机器人,这也让全球的观众第一次对机器人有了具体的印象。马斯克在去年秋天的 We, Robot 活动中介绍特斯拉 Optimus 时,也说:
Optimus 将是每个人自己的 R2-D2。
在大模型技术日新月异的今天,具身智能的机器人事实上已经成为了一种共识,然而优先发展人形机器人,还是非人形机器人仍然存在巨大的争议。
但有一点是明确的,包括芯片厂商地瓜机器人(从地平线独立出来的机器人部门)、人形机器人厂商智元机器人都表明过,通用的人形机器人距离实际走进我们的生活都还有很长的一段路要走。
相比之下,非人形的家用机器人,在大模型技术的快速迭代下或许将更早走进我们的生活,成为人类的第一波机器人浪潮。