搜索

您当前位置:主页 > 新闻动态 > 行业新闻 >

新闻动态
语音交互风头正劲 巨头们铆劲发力布局

类别:行业新闻   发布时间:2020-09-03 21:33  

  

  人工智能技术浪潮的来袭,将我们带进万物相连的物联网时代。新的时代下,语音交互成为了人机交互的新方式,几乎所有的硬件产品都打出了“语音交互”这张牌。语音作为人类最自然的交流方式,比文字和图像更具天然的优势。公开数据显示,2018年,30%的人机交互将通过语音完成;2020年,至少50%的搜索将是语音搜索。语音交互作为人机交互的重要演进方向,正在逐步深入到我们的日常生活和工作应用中去。

  语音交互风头正劲,各大巨头都不想输在起跑线上。为了争夺这一入口,巨头们在语音交互领域大力布局,展开了一系列的疯狂竞赛。苹果Siri,谷歌Assistant,微软Cortana,亚马逊Alexa纷纷拓展生态系统,积极推出自己的语音产品,加大对语音交互市场的争夺。

  Home

  2014年11月6日,亚马逊发布搭载语音助手的音箱AmazonEcho,不止局限于音乐播放,内置的Alexa语音交互系统还能进行智能家居设备控制。而谷歌随后发布的GoogleHome,一直在与Echo争抢home场景的中枢角色。国内包括京东、阿里等巨头都在布局Echo类产品。万万没想到,在《碟中谍4》中,阿汤哥通过用语音来开灯、开电视的生活场景,被搬到了现实生活中来。

  Car

  语音交互是辅助驾驶的最好交互方式,这也使得汽车上的语音产品成为兵家必争之地。数据显示,在美国,平均每四起因使用手机导致的车祸事故中,就有一起是开车时手持接打电话引起的。我们知道,最安全的驾驶姿势,一定是目视前方、手握方向盘,语音交互在car场景的应用,释放了驾驶员的手和眼睛,让驾驶员专注于眼前的路况。特斯拉可谓语音交互在驾驶场景应用的鼻祖,语音控制系统的加入给汽车这个古老行业带来了朝气。之后,苹果在AppleCarPlay内置Siri实现了语音交互,国内语音厂商科大讯飞,为汽车提供语音交互系统,其中有宝马、雷克萨斯这样的豪华品牌。

  Onthego

  在科幻电影《Her》中,男主戴着小巧的无线耳机,不论上下班、逛街,还是去海边,都可以随时与耳机内置的语音助手对话,甚至谈起了恋爱。现实生活中,和语音助手谈恋爱目前是不可能的,但不能否认,小巧的智能无线耳机,确实给外出出行带来了便利。正是瞄准了人们onthego场景下对方便的需求,智能耳机出现了。2016年苹果推出airpods无线耳机,用户通过蓝牙连接手机之后,借助Siri语音交互系统操作手机。而国内推出的Vinci智能耳机,作为一款集耳机和播放器于一体的独立设备,甚至不需要连接手机,唤醒语音助手小me后,语音控制实现音乐播放、电话接打、心率查询、收听新闻等服务。语音交互省去了用户手动操作繁琐的步骤,给户外出行带来了便利。

  谁更具市场潜力

  按照距离麦克风的远近,以上三种语音交互的场景,可分为两类:一是远场语音(在车载、智能家居环境下,离麦克风3-5米),二是近场语音(嘴巴贴近麦克风,与产品对话)。

  AmazonEcho系列产品在2016年卖出了超过650万台,可谓远场语音的典范。亚马逊将语音交互落地到智能家居上,加入麦克风阵列,对不同方向的声音信号进行处理,解决了部分远场化的问题,但是由于定向拾音的角度有限,说话人的移动成为问题。亚马逊Alexa负责人ToniReid认为,“当用户下达语音指令后,Alexa实际上只有一次机会去部署相应的动作,而不能去和用户进行多轮对话,反复对话对用户来说是很糟糕的体验。”

  2011年iPhone4s发布Siri语音助手,是苹果在语音交互棋盘上下的第一颗棋子,之后Siri不断迭代,但在远场语音方面,Siri比不上ALexa。因此,苹果选择以近场语音交互为主的airPod为切入点发力,这一举措巩固了苹果在近场语音中的王者地位。数据显示,airpods上线短短一个月,就异军突起占据了美国无线耳机26%的市场份额。

  相比音箱,耳机的利用率更高。智能家居、车载语音产品,要依托一个固定的环境,从这一点来看,以智能耳机为代表的近场语音产品更个人化。远场语音下,用户总是要保证声源距离,才能完成语音交互,若声源距离较远,音量不够大,那语音识别率将会大受影响。戴在耳朵上的智能耳机,离人的语言器官嘴巴近,当你和耳机进行语音交互的时候,更像是和朋友交谈。这就如同大声嘶喊和两个人窃窃私语。

  耳机的携带方便,决定了它有更多自然的使用场景。以电脑和智能手机为例,当电脑发展成为基础设施走入千家万户,几乎人手一台,用户长时间大规模的使用;后来,几乎兼容电脑的智能手机,扩充了传统手机的使用范围,并且体积轻小携带方便,用户量迅速扩展,人们自然而然的从PC时代迈入智能手机时代。

  MSR首席研究员、语音专家俞栋指出,“目前一般远场识别的错误率是近场识别错误率的两倍左右”,当产品真正落地的时候,近场语音带来了更好的用户体验。

  2016年,“互联网女皇”的玛丽?米克尔发布的2016年互联网趋势报告中,谈及“语音正在被重塑,成为人机交互的新方式,在过去75年里,每10年就有一次人机交互的重大革新,人类对机器的操作,从物理手柄按键,到物理键盘鼠标,再到触摸屏,现在语音成为了重要的交互方式。”在这场语音交互入口争夺战中,以智能耳机为代表的“onthego”场景语音产品,因为更接近语言交流的器官,应用场景更广泛,或将成为语音交互的最大入口。