智东西
作者 程茜
编辑 心缘

智东西2月27日报道,昨夜,亚马逊生成式AI版智能助手Alexa终于现身!这也是Alexa自2014年发布至今,近11年后的首次重大更新

升级后的Alexa被叫做Alexa+,可以与用户自然对话,还能记住家庭不同成员的个人习惯提供个性化建议,完成制定旅行计划、提炼邮件重点等各种复杂的任务。彭博社知名记者马克·古尔曼将Alexa+称作“加强版的ChatGPT语音模式”,令人印象深刻。他还提到苹果在这个领域落后了很远。


现场演示中,Alexa+可以根据用户指令自如切换播放设备,让音乐、视频在不同房间流转;能与家庭中的安防摄像头联动,自主调出与用户指令相关的视频片段,如“遛狗了吗”等;可以完成各种复杂指令,如根据家庭成员的习惯选择餐厅、预定餐厅,叫出租车去机场接客人,然后实时同步出租车信息等。

Alexa+的能力是基于亚马逊Bedrock平台来访问最先进的大语言模型,其中既包括亚马逊自己的Nova模型,也涵盖了AI独角兽Anthropic的模型。截至目前,亚马逊在全球已售出超过6亿台搭载Alexa的设备。

不过,该服务并没有立刻推出,将于未来几周内开始在美国推出,随后在未来几个月内开始在Echo Show 8、10、15和21等设备中推出。其费用是每月19.99美元,Prime会员可免费使用(Prime会员费用是每月14.99美元或每年139美元)。

值得一提的是,这也是亚马逊设备业务主管Panos Panay首次主持亚马逊相关硬件活动,他于2023年从Dave Limp手中接管了亚马逊的硬件部门。

一、生成式AI加持,Alexa化身舞台操控师、家庭全职保安、邮件整理专家、儿童陪伴专家

生成式AI版的智能助手Alexa+有几大核心升级:自然对话、个性化交互、完成复杂任务、更聪明

首先在对话方面,它可以理解上下文含义与用户进行自然、流畅的对话。其次,随着使用次数增加,Alexa+可以了解到用户家庭中不同成员的饮食偏好、习惯、过敏等,从而为其提供更加个性化的答案。此外,Alexa+可以完成从制定约会计划、到购买礼品、安排旅行等复杂任务。

//oss.zhidx.com/uploads/2025/02/67bf4ac2efe76_67bf4ac2ec551_67bf4ac2ec517_UQj1kT9DfjJITP2O.mp4

正式演示的时候,Alexa+身兼数职,化身舞台操控师、家庭全职保安、邮件整理专家、儿童陪伴专家……

发布时,Panay周围摆放了数台Echo Studio设备,他先给出指令:“开始播放Lady Gaga的《Shallow Ground》”,然后告诉Alexa+在左边和右边播放音乐,其会自动改变播放歌曲的设备。然后他说“把音乐移到电视上”,Alexa就自动将播放设备切换至Fire TV。

Panay接着说:“你能直接跳到电影中的那个场景吗?”然后Alexa会自动将电视上的电影转移到播放歌曲的设备中。

//oss.zhidx.com/uploads/2025/02/67bf4e48479f6_67bf4e48343ed_67bf4e48343bf_Download.mp4

▲Alexa+根据指令控制音乐播放(视频来源:Tom’s Guide)

Alexa+还可以与Ring的安防摄像头联动。当演示人员询问:“Alexa,我家周围今天发生了些什么事?”Alexa就会将摄像头拍到的关键信息进行截取呈现。然后,Panay问“是否有人遛过他的狗”,Alexa就截取了他家狗被遛的片段,以及狗跳上亚马逊的送货卡车、被司机投喂的镜头。


还有一项新的Alexa+功能。用户可以与其共享电子邮件、产品手册、食谱、学习材料等各种文件,Alexa+会从这些文档中提取和调用相关信息,为用户提供摘要并根据特定请求将事件添加到日历中。


有两项针对儿童的Alexa+新功能:提问、编故事。孩子们可以向Alexa+提出各种关于地理、生物等方面的问题,智能助手会通过对话的方式进行回答;第二项功能是编故事,孩子给出指令后,Alexa+会向孩子提出其他问题,以帮助填写故事情节。

二、浏览器、App、智能音箱无缝衔接,能自主链接外部网站

为了方便用户使用,亚马逊为Alexa+推出了全新用户界面,并且正在推出alexa.com网站和新的移动应用程序。


在使用过程中,用户不会受设备切换限制,能在Echo设备、应用程序和Web浏览器连续体验,Alexa+可以记住对话上下文,不同设备切换也不会影响对话效果。

开发人员可以通过API直接集成。例如,当用户想要预订晚餐时,Alexa+会完成订餐、接客人、订车等一系列工作。它首先会直接与美国在线订餐平台OpenTable连接,然后Alexa+会提供叫Uber去机场接人的预估费用以及到达时间、发送短信给客人同步Uber的信息。

如果没有外部化的API,Alexa+也能够链接到亚马逊合作伙伴的网站来完成任务。演示人员演示了一个厨房的紧急情况。

他提出指令:“Alexa,我的Miele烤箱不工作。你能派人过来吗?”Alexa+提供了多个电器维修服务平台,然后在演示人员选择了一个之后,Alexa通过Thumbtack网站与这些平台取得联系。


现场,他们展示了Alexa+与音乐生成工具Suno的集成,用户可以将简单的请求转化为完整的歌曲,包括人声,歌词和乐器。他宣布了新的Alexa AI Multi-Agent SDK的预览,该SDK将允许品牌与Alexa一起展示他们Agent。


最后,演示人员展示了Alexa+未来的一项功能,该功能将使用户在对话中创建和编辑购物清单、根据饮食偏好修改清单,并向Amazon Fresh订单添加物品等。现场演示人员给出的指令不仅仅是配料,他在说话的过程中多次停顿或者增加、改变指令,如“我需要香蕉面包的所有东西,除了香料”,“将一加仑牛奶改为两加仑”,“添加更多鸡蛋”、“还有一个孩子要来吃晚饭”等。

此外,亚马逊与数十家新闻和体育媒体合作,使得Alexa+能获取到最新的新闻和信息。

三、根据特定任务自选模型,让Alexa拥有实操能力

研发人员提到,Alexa+可以利用亚马逊Amazon Bedrock平台来访问最先进的大语言模型,其中既包括亚马逊自己的Nova模型,也涵盖了AI独角兽Anthropic的模型,其采用了一种与模型无关的系统,使得Alexa+能够针对任何特定任务选择最佳的模型。

Panay谈到了亚马逊对Alexa的终极期待。

聊天机器人本身无法帮助用户完成订购商品等任务,亚马逊需要Alexa与周围事物产生连接并实际采取行动。Panay把它比作一个管弦乐队:每个乐器都可以独立工作,但需要一个指挥把它们组合在一起。

此外,亚马逊CEO Andy Jassy还提到,亚马逊使用AI来解决真实的客户问题已经25年了,但最近随着生成式A的出现情况发生了变化。他谈到了亚马逊的三层AI体系:

底层是亚马逊自研芯片为模型训练提供更高性价比,以及使用亚马逊的SageMaker AI来构建、训练和部署机器学习模型;中层是基于针对AI生成的图像和文本的云服务Amazon Bedrock,让多个AI协同工作;顶层是用于由第三方公司构建的生成式AI应用程序,这主要针对两个方面:成本规避和客户体验。

结语:亚马逊加速寻找生成式AI时代Alexa新变量

去年9月,亚马逊就公开了搭载大模型的Alexa新能力,呈现出引入大语言模型,语音助手、智能家居设备等智能终端将更准确地理解用户的指令和需求的潜力,从而实现智能终端更加智能化、人性化,满足更自然、更流畅的交互体验。

自2014年推出以来,亚马逊已向Alexa投入了数十亿美元。但多年来Alexa缺乏革命性的升级,使得诸多用户的使用频率降低,在AI时代这一现象尤其明显。如今,这一发布11年之久的智能助手终于迎来重磅更新,并呈现出更强大的功能和更丰富的应用场景,对个人生活、智能家居、教育、娱乐等多个领域或许都将产生更深远的影响。

ad1 webp
ad2 webp
ad1 webp
ad2 webp