用车综合

从Siri到科大讯飞 语音识别正在改变谁?

发布时间:2017-11-11

从Siri到科大讯飞 语音识别正在改变谁?

  记得Siri首次出现时,人们第一次对于语音交互表现出了从未有过的关注和兴趣,即使大家都习惯“咻”的一声传递自己的问候,但文本输出依旧在很多场景下有着不小的刚需。可敲字又太麻烦,如何巧妙的运用语音识别技术在该领域找到突破,让信息传递者高效的将自己的话语快速精准的输出成文字语言,似乎成了一个值得关注的问题。

而在车机领域,这边的变革也在悄然发生,越来越多的中国品牌车企发力语音识别技术,相比传统的多媒体系统,语音识别技术显然可以通过更高的性价比获得更好的用户体验,能叨叨就不动手似乎成了一个风向标。而这其中一个重要的技术环节:目前由科大讯飞所引领的人工智能语音识别技术,似乎就成实现这一切的关键……


前言1:老年人的困惑

老爸之前一直和我叨叨,说自己的手机屏幕不够大了,字儿太小!看着费劲,后来我给他换了一个6英寸的手机,但他似乎还是不太满意,说现在这手机都不太照顾老年人,每次给我发点信息,手写输入的反应老是和自己较劲,试试拼音输入?那你还不如要他命呢……


前言2:快递小哥的神器/旅行者的手记

语音识别技术不仅方便了老年人,年轻人也因此受益不小!一次偶然的机会,朋友推荐我试试现在的语音输入法,据说一分钟能打好几百字呢!亲自试了一下,颇为吃惊,如今的语音识别都这么精准了?后来他和我说:他也是见着送餐小哥这么想玩,他才试试的,结果还真不赖。就是这次偶然的小事儿,真是让我对如今语音输入这事儿高看了不少。


再来说说我另一个小伙伴的经历,她是个旅行爱好者,经常全国四处转悠,在走访风土人情的过程中,经常需要边走边记,她们管这叫手记,用于回来写作,虽然手机里都有记事本App,但如何以最快最短的时间记下关键内容,这事儿让她纠结了好几年!然而随着云端语音的发展,如今依靠一个App,就可以做到一边聊着边自己说,这就算记完了,你说爽不爽?


语音识别正在改善我们的在线沟通方式,虽说手机输入法已经很完善,但在很多时候,敲字边、手写多少会显得有些不合时宜,而语音识别的出现,显然更符合国人的“沟通习惯”,最主要的是,它可以更好的满足大部分人群的场景需求!比如老年人,比如会议,比如旅行或者记录。

 它的效率主要体现在,就算发语音,你是不是也得听一遍?转换成汉字的话,一目了然。而且容错率比较高。何况有些场景下(比如开会中,群聊,工作群,会议群等),听语音可是个很招烦的事儿。

几曾何时,车载的“语音命令”功能是多么招骂?

很多人对于语音命令特别唾弃,你却不知,语音命令从20世纪50年代初就开始存在了,那时最先开始研究它的是IBM,那时它主要被设计用来检测特定的语言模式并得出声音和它对应的文字之间的统计相关性,当时那个产品叫做VoiceType。后来IBM将这项技术授权给了一家叫做ScanSoft的公司,时间到了21世纪,随着企业之间的兼并,viaVoice早已淡出人们的视线,取而代之的是Nuance公司,而它,就是后来苹果Siri语音识别的核心技术供应商。


“从10万到50万:科大讯飞正携手中国品牌集体发力?

谈起语音识别,先得说车上那块屏,也就是多媒体系统,大部分对于它的使用率简直是太低了,体验差,操作繁复,这是吐糟最多的!哪怕是如今上百万的车机系统,除了那些堆砌起来的华丽和逼格外,真正有多少人会充分利用那些过度宣传的“功能们”?极少!连多媒体都这样,何况那些曾经搭载语音命令的车型了,不天天喷你就不错了,直到科大讯飞的识别技术被普及,之前的情况似乎真的有所改观了……

“十来万块钱儿”能有什么样的体验?---------先来看看中国品牌的表现!

之前我们体验过吉利博越、帝豪GS、奇瑞瑞虎5、长安CS95在内的众多中国品牌车型的,基本都在10万元上下的价位。它们在这些产品上的主销车型上都采用了科大讯飞的语音识别。

仅从我个人来看,我认为目前中国品牌集体发力语音识别,可能存在这么几点前提:1、传统的多媒体系统被人诟病无数,华而不实的硬件堆砌最后多数都落得个费力不讨好的下场。2、语音交互在硬件上并不需要太繁复,但却可以实现更好的体现,正好迎合了“行驶场景”下的刚需。3、和德系领衔的“高大上”科技路线相比,这显然是性价比足够高,体验足够好的方案。4、科大讯飞作为目前国内语音识别领域的大头儿,又是本土企业,中国品牌无论在定制、适配还是体验改善方面,拥有更多的话语权和主动权。

长安语音识别

先说长安,之前我们在CS95车型上曾经体验过它的语音识别系统,它提供了4G网卡和SOS紧急救援电话等车联网功能,在语音识别方面,识别率没问题,对于POI兴趣点的识别也不错,但在反应速度方面它比其他几位中国品牌对手还是要稍微逊色一些,稍有遗憾。

奇瑞语音识别

奇瑞搭载的Cloudrive智云平台如今已经发展到2.0版本,3.0版本也将于近日发布,并且它很可能会成为科大讯飞AIUI平台的首批适配者,非常值得期待。从之前的体验来看,它的语音识别也是没得说的,识别率和反应速度都不错,属于第一梯队的水平,并且同样采取了免费送流量的方式来促进云端语音识别的实用性。

上汽语音识别

上汽的方向则稍有不同,它在系统级操作方面的优势会更大一些,比如空调和天窗,比如能这识别主副驾语音,这些颇具互联网气息的设计思路都出现在了上汽的车型上,部分需要和CANBUS总线通讯才能实现的功能在上汽的车型上都有所展现,而且同样可以使用语音轻松完成,而在听歌、导航、电话方面,它的语音识别表现也是同样出色的。

吉利语音识别

最后谈一下吉利的表现,无论是反应速度,识别率,还是POI信息的抓取,都是比较准确的,而且目前还有免费送流量的活动,基本上听歌、打电话、导航,这几个核心诉求你都可以动动嘴轻易完成,手机基本不用参与了。要说缺点,那就是系统整体还是被限制在多媒体的范畴之内,没能实现和空调等车内设备的联动。


怎么样?我没说错吧,中国品牌目前正以迅猛的速度布局语音识别技术,除了上面展示的几个品牌外,像是广汽、江淮等众多中国品牌和合资品牌,比如雷克萨斯,它也已经在最新的车款上配置了科大讯飞的语音识别系统。众人拾柴火焰高,第一次由中国本土企业引领一番多媒体变革,讲真,心里还是挺激动的。这绝对不是YY,为什么?

大家都知道“BBA”,之前它们都在自己的科技风格上耕耘多年,然而就在语音识别大潮爆发不久,宝马突然在最新年代款的3系上搭载了NLU自然语音识别系统,这一突然的转变还是让很多人眼前一亮的,不仅于此,之后对于这套系统的好评也是源源不断,下面我们也简单看下这套系统的表现,让大家对此也有个概念。“原来豪华车也可以这么玩

最先投入语音识别怀抱的宝马---------高端品牌也能换个方向玩?

虽说多数高端品牌车型的多媒体系统总被人诟病华而不实,但在这其中的宝马,口碑则一直是可圈可点,如今它也率先在自己的3系车型上搭配了科大讯飞的语音识别技术,之前我曾深度体验过,虽然华丽程度比不了7系,但对于3系来讲,顺滑的语音交互体验是个不小的惊喜和提升。


宝马给我印象最深的,还是它的默认唤醒机制,就用自己方向盘上的语音键,不仅充分利用了硬件的布局,而且相比中国品牌那一票“你好 XX”要好很多,这说的是用户体验。

其次就是它的反应速度和识别率了,非常高,能和中国品牌第一梯队达成平手,对于比较口语化的句子也能很好的理解,让我印象最深的就是,我说:“车没油了”。它不仅找到了附近所有的加油站,而且还在我选择了某个加油站后,继续提示我:“您的油量不足以到达目的地”。这点就很牛B了。

编辑有话说:

 “中国人没有发明VISA卡,但我们却创造了支付宝”我觉得用这句话来形容科大讯飞如今在语音识别领域的成绩是比较恰当的。语音识别的突飞猛进,绝不仅是对于沟通方式的一种进步,当它和人工智能技术相结合之后,谁也无法估计它会延伸出多少可能性。

仅从目前得到的信息来看,识别技术能在帮助更多的孩子们获得更好的教育体验,实时解析老师在课堂上的重点,根据学生的作业分析他的弱点,从而帮助他找到最有针对性的提升方案。在,医疗领域,它还将协助医生们更好的识别癌症,判断病情,从病人的口述中迅速识别他可能存在的病情,这一切都需要深度的大数据学习和精准的识别技术才能实现。

而在汽车领域,识别技术的下一段应用显然和智能交通、自动驾驶密不可分,在未来,也许你真的会像《霹雳游侠》里那样,毫无门槛的和你的爱车沟通你的一切需求,它将帮助你搞定沿途所有的问题,而你只需要享受旅行的过程就可以了。

而汽车对于我们的属性和定义也可能随之再次改变,比如,汽车从一个交通工具转变成为移动的多功能的空间,比如汽车可能成为了会议室、影音室、卧室、社交场所等,从而会带来更多的细分产品和服务,商业模式也会多样化;我相信,汽车很可能会从如今的一次性买卖转变成和用户终身相连的服务。(文/图 汽车之家 任博)

推荐资讯

全国最大的AMG俱乐部 TAC成立两周年聚会

技术改变生活 那些渐渐消失的汽车故障

冬天在车里睡觉会死人?我们做了个实验

从Siri到科大讯飞 语音识别正在改变谁?

能带来幸福感 体验瑞虎5x多媒体系统