应用

技术

物联网世界 >> 物联网新闻 >> 物联网热点新闻
企业注册个人注册登录

让人跟车多聊两句,有多重要?

2018-09-17 14:55 亿欧

导读:技术、车企合作、综合生态,人车交互产业或许正在跑着一场铁人三项。但在无人驾驶真正到来之前的相当长一段时间中,车载语音交互都会是汽车场景技术与体验进化的主旋律。在语言的迷宫下,人和车以另一种方式相遇了。

  “BAT抵达车联网”,是最近引发无数媒体关注的一个“风口话题”。

  在热闹的讨论中,我们知道了这个火热的赛道上有BAT等科技巨头,还有传统车企,造车新贵,以及解决方案提供商,一时间风起云涌好不热闹。

  但如果我们从头琢磨一下,可能会发现今天对车联网的讨论,多少有点“失焦”:所谓车联网这个赛道,究竟在争夺什么?而BAT进场与不进场,到底有什么区别?各家科技巨头与车企在车联网领域的进度各有什么不同?

  这些问题的答案,很可能藏在一个很多司机今天还并不重视的角落里:人车对话。

  人和车聊天这事儿,真的有这么重要吗?

  咱们先来思考这么一个问题:给车连上网,到底干嘛用?

  声音是不可代替的交互:车联网赛道的真正轴心

  我们知道,所谓的车联网,是泛指通过汽车端的信号传输装置,接受网络信息与服务的技术解决方案。包括车辆远程控制、远程安全、驾驶场景下的网络服务等多个领域——也就是所谓的让车变成一个终端。

  而今天热络的车联网产业,普遍关注的是两个问题:

  1、改善驾驶效率与体验。比如用户可以基于互联网技术控制汽车、辅助驾驶等等。

  2、获得驾驶外的增值服务。比如用户通过车载网络获得的导航、内容、天气、支付服务等等。

  那么重点来了,这两种服务到底要怎么赋予驾驶者呢?

  都集成到手机上…开车玩手机好像不对?放在车载屏幕上,让用户触屏控制?哪有人那么闲没事停车触屏一下再开?而且既然都停车了,那干脆玩手机好不好?

  所以有种说法,叫做车上最没用的设备就是屏幕。可以说,在车联网的商业想象中,让用户放弃方向盘来获得网络服务,是一种反人性的设计。那么网络服务、驾驶服务怎么才能无缝对接给驾驶者呢?答案只可能是人车语音交互。

  让驾驶者通过语音来控制一部分不方便控制的车载设备,再通过语音交互来获得外接互联网服务,是车联网场景中唯一成立的交互模式。可以看到,在初期试水之后,无论是车厂还是科技企业,都将矛头对准了人车对话交互这一块“车联网枢纽”。

  而在车载语音交互的成长过程中,科技巨头陆续进场与独角兽崛起,就变成了一个合乎技术逻辑的事情。

  车载语音交互不长的历史上,已经涌现出了以下几种“江湖流派”,让“语言交互战”成为了车联网战场上货真价实的战略高地

  安卓改装流:国产车的常规套路

  最早认识到语音交互价值的,当然是汽车企业本身。而最早布局车联网系统的,也是一批以自主品牌车厂为主的车企,他们普遍通过改装原生安卓的方式来搭建自己的“车载UI”。

  而在这套交互逻辑里,也涌现出了原生版本的车载语音交互。

  这种 “原生态”语音交互系统,一般由车企自己开发,实际技术供应商往往是长三角、珠三角的小工厂,因此没什么技术研发成本。一般来说形式是一个安卓系统改装的操作平台,然后用户可以在车载系统上安装各种各样的APP,形似一个安装在车上的安卓平板。然后用户可以使用某些APP中的语音控制,来控制FM、地图等应用。

  吉利吉客、比亚迪Dili nk等系统算是这个流派中相对成熟的。这类车企自制系统,优点是成本低廉,可以某种程度上作为营销噱头。

  但缺点也十分明显:由于必须进入APP内部的语音交互,所以用户说什么其实与车无关,只是控制APP而已。而且往往交互逻辑中有大量需要触屏操作的地方,用户在行驶中必须经常触屏,对交通安全也是个隐患。

  总体而言,改装安卓流派并不被看好。所以,有AI技术撑腰的科技巨头们来了。

  车载音箱流:科技公司进场人车交互的开端

  今天更多主流车企,开始注意到了车内语音交互能够带给驾驶者诸多便利,甚至可以说是车载显示器唯一合理的解决方案,于是主流车企+车载语音技术开始热络了起来。而科技巨头以自己的语音技术优势,切入车联网领域,就变成了顺理成章的情况。

  国内的Apollo小度车载系统,国外亚马逊的Alexa,都可以作为车企的语音交互解决方案来进行合作。

  比如说,今年早些时候,宝马已经宣布将与亚马逊的Alexa合作,在新出车型中搭载车载语音助手。驾驶者可以与语音助手直接对话,查询地点、选择想要收听的内容,以及相应的综合服务。而用户可以选择是否需要搭载Alexa。

  这种模式,从技术逻辑上来看,可以被理解为在整车完成后,把语音助手集成在车载交互中,嵌入到车辆的网络交互设备里。说白了,有点像在汽车中安装一个智能音箱,只是在交互形态和使用目的上与家用音箱不同。

  还有一种科技企业的进场方式,是向车企的车联网项目输送技术。比如东风风神与百度DuerOS、博泰共同打造过Windli nk 3.0。百度在其中扮演AI语音技术输出商的角色。

  目前,国外的亚马逊、微软,国内的科大讯飞、百度DuerOS,都有相应的车载交互体系,已经被搭载到很多车辆当中。

  这种嵌入式的车载音箱流,优点是基本以成熟的AI语音交互系统作为底本,能够产生不错的对话体验。无论是方言识别、自然语言处理还是对用户的数据学习,都比原生态版本强出一大截。

  相应的问题是,这类系统由于大多是后装或准后装模式,无法与汽车建立底层的机械联系,所以能够带给用户的操作比较有局限性。说白了,这更像是车企为由需要用户准备了一份锦上添花的礼包。

  但如果语音交互向走的更远,车企与科技企业似乎必须走的更近才行。

  整车前装流:巨头酝酿中的下一个故事

  在读者相对更熟悉的无人驾驶领域,我们已经可以得出这样一个结论:抛开车厂玩科技,基本是条死胡同。

  在人车交互领域同样如此,假如离开了车企的制造基础,那么科技企业带来的感知智能交互技术,就像是在车内摆放了一盆可有可无的装饰。

  只有科技企业与车企更紧密合作,将人机交互的可控范围加大,车联网技术才可能带来真正的驾驶升级体验。这或许也意味着,车载网络交互系统,必须有后装改为前装:让AI语音系统可以进入汽车的机械系统里,甚至尽量靠近控制中枢。

  换言之,语音交互能够部分取代车辆驾驶控制,在科技企业看来才是王道。

  这个领域已经有科技巨头进驻,比如阿里与上汽合作的斑马网络,核心业务方向就是结合AliOS的整车底层平台,为车企提供前装人机交互系统。

  前装的直接价值,在于能够让语音交互控制车上更多的部件。比如车窗、雨刷、天窗、空气净化器等等。

  另一个意义在于,前装可以在车上安装更多传感器与麦克风阵列,让人控制车的同时,车也可以主动感知到人的存在。由此能够分清谁在说话、判断每一个人的状态等等。

  此外还由一个区别在于,科技企业假如只提供技术解决方案,那么车联网连接的将还是一般互联网内容,无法获得专属于车的支付、内容、旅游等产品服务,而前装系统可以直接绑定车主ID,这是让车变手机的一个先决条件。

  当然,整车前装AI交互系统的故事才刚刚开始。

  一方面大量车企并未适应这种模式,因为想要获得更好的语音交互体验,系统需要直接接入车辆的机械控制中枢,这在很多车厂看来是有安全隐患的。

  但整车前装,科技企业与车企深度合作的路子很可能会越走越远。今年 Google I/O 大会开幕前,Google 还宣布了与沃尔沃的合作,双方会合作打造不同于安卓的车载智能系统。科技企业走向与车企的平等合作,AI语音交互成为车辆本身的一部分,在方向上应该没有什么疑问。

  当然了,我们更期待的,可能是语音交互成为驾驶的全部。

  无人驾驶流:人类还在等待的人车对话

  显然,车联网技术真正在等待的,是与无人驾驶的合流。虽然这个目标在今天来看还远,但从技术逻辑上看,车辆语音交互有一天会成为全面取代手动的交互模式。

  就像今天有些车主会坚持认为,我用手控制挺好的,为什么要说话控制车?这其实涉及很多驾驶习惯问题,难以一概而论。但不可否认的是,假如最终我们只用说说话,车就可以准确舒适地把我们带到目的地,那么与车的对话将具有绝对价值。

  这个逻辑所形容的,是L4级别无人驾驶中的语音交互。这个层级里,车辆将抛弃方向盘,也就是说驾驶场景已经被取代。但如何获得更舒适的出行体验、选择道路导航方式、紧急情况下的制动,今天看来还是需要人类进行主动干预的。而干预的方式,应该还是以人车对话为主。

  今天已经有很多无人驾驶项目,开始研发无人驾驶场景下的人车对话机制。这种场景下,用户需要下达的命令往往是复杂抽象的,有点类似我们做出租车时给司机的建议。那么要让无人驾驶系统具象化这些建议,并落实成出行模式,就需要强大的自然语言处理能力、深度语义理解能力作为支撑。

  作为无人驾驶的必备配套技术,这个领域目前已经汇集了中外各路AI豪杰和车企,但同时也存在大量机会。让人车可以像乘客和司机一样对话,还有很远的路要走。

  车载语音这条赛道,究竟在比什么?

  综上所述,车联网这一局棋,某种程度上来看,真正在考验的是车载语音交互的技术解决能力和综合服务体验。

  因为驾驶时的网络服务必须围绕声音进行,那么声音能够获得的权限越大,交互技术越精准,生态服务越充沛,消费者的体验也就会越好。

  这一场关于人车对话的赛跑,无论是科技巨头,还是新晋独角兽、造车新贵,都必须考虑三个方面的问题:

  1、AI语音技术的体验分:AI语音交互、IoT系统、云计算,这些技术体系进入汽车,是一个广泛而深刻的过程。而这个过程中,对科技企业拿出的技术解决能力是有严格要求的。车载场景不同于家居,有复杂的干扰环境,和必须快速执行命令的性能要求。如何让人车对话时,可以更好地完成远场唤醒、方言识别、特殊语序识别,是接下来AI公司需要继续努力的。

  2、与车企合作的亲密分:如果我们认同语音交互控制车辆部分越多越好,前装优势大于后装这个逻辑,那么人车交互体验就是建立在科技企业与车企的紧密合作基础上。而在今天,即使是已经全面领先的斑马和AliOS,也面临客户群不够多、合作品牌相对单一的问题。如何让高端车、合资或者外资品牌车也部署“中国智造”的AI交互系统,或许还是任重道远的工作。

  3、外接生态的服务分:对于车主来说,真正的价值撬点可能并不在语音控车上,而在于车载系统能够提供的导航、内容与综合服务生态,是否真正带来了体验改变。而这对于人机交互技术的提供者来说,还是相对困难的。而外接生态相对成熟的互联网公司,似乎在这个逻辑上更有胜率。

  技术、车企合作、综合生态,人车交互产业或许正在跑着一场铁人三项。但在无人驾驶真正到来之前的相当长一段时间中,车载语音交互都会是汽车场景技术与体验进化的主旋律。在语言的迷宫下,人和车以另一种方式相遇了。

  而就车联网而言,一个探寻的时代,也许会从语言与声音的魔法中,慢慢开始它的觉醒。至少相比大部分车联网伪需求来说,用声音来触发服务,是驾驶场景中无可避免的选择。