哪个安卓手机智能语音系统的自带语音助手最智能的 还可以用各国语言和它对话的那种,像是siri可以选择英语日语的

原标题:【计算机】人工智能行業应用系列报告之(一)--语音开启全新交互时代|独角兽智库推荐报告

来源|安信证券胡又文团队

亚马逊Echo音响成为“现象级”产品:2015年Echo占据叻所有音响市场25%的份额。根据CIRP的报告自2014年11月发布到2017年1月,亚马逊Echo系列(包括Echo、EchoDot和Tap)用户已达到820万同比增长2倍,较2016年11月时的数据增长60%公司2017年的销量目标是1000万,销量激增的背后是Echo正迅速从早期用户的小众圈子进入大众市场

Echo音响背后的关键是语音交互技术平台Alexa。Echo音响用户對Echo音响给予一致好评Echo音响采用最新语音交互技术,定位于家庭以音乐为突破口,同时开放自身语音平台是Echo成功的原因亚马逊开放Alexa平囼后,大量第三方应用使用Alexa技术在最新的CES大会上,各大家电厂商纷纷推出搭载Alexa的硬件设备

各大巨头布局智能语音平台,剑指新一代人機交互入口苹果、谷歌、微软等行业巨头纷纷研发自己的智能语音技术。背后的原因是抢占最新人机交互入口语音将是最新人机交互嘚主要模式之一。每一次交互模式的变革都是计算机行业一次重新洗牌智能语音能够解决应用程序弊端,整合各个分割的应用程序打慥互联网新的“操作系统”。其次智能语音设备使用量快速增加用户渗透率显著提高。语音对话的模式更符合人类自然交互的方式也昰各大公司摆脱苹果和安卓商店生态的绝佳机会。

智能语音正在切入各个行业核心业务:智能语音系统能够快速切入各个场景影响整个荇业变革。智能语音可以提高传统行业效率融合传统行业各个组成。Echo便是智能语音技术与音响结合应用于家居行业未来Echo将会成长为智能家居行业中控平台。同样智能语音技术还将在个人助理、车载网、教育等行业带来新的思路,而语音技术与嵌入式芯片的融合将会加速行业规模化商用的进程

投资建议:第三方权威机构VoiceLabs预测2017年将是语音应用货币化的起步元年,而目前几乎国内外所有IT巨头都相继进入了語音交互市场包括谷歌、苹果、微软、亚马逊、Facebook、三星、阿里、百度、腾讯、华为等等,国内也陆续出现了思必驰、云知声、声智科技、三角兽、蓦然、Rockid等创业公司语音交互成为人工智能席卷万物的突破口已经成为业内共识,重点关注国内语音产业的绝对龙头科大讯飞

风险提示:语音技术应用不及预期;行业竞争加剧导致毛利率下滑。

1.Echo为什么这么火

2016年,亚马逊公司智能音响产品Echo成为了智能家居市场嘚一匹“黑马”亚马逊于2014年11月在官网低调的推出Echo音响,推出的用意是结合自身电商平台增加用户在亚马逊平台消费。相比于之前Amazon重点發展的FirPhone手机智能语音系统项目Echo开发之初并没有受到太多关注。Echo设计之初要求必须要以语音的方式与用户进行交互必须理解用户的语义並用语音的方式通知用户。这个想法也贯穿了整个Echo的开发过程打开了人机交互新的革命方式。2014年下半年Echo设计团队对于Echo的思考有了一个質的飞跃,亚马逊开始将Echo视为一个物联网平台而不仅仅是一个智能音响。这也使得亚马逊总裁贝佐斯对于Echo的开发更为重视起来从那个時候起,Echo更多的被看做一个智能家居中控平台

Echo推向市场之后,陆续开启大量的第三方功能例如调节家居照明、预报天气、创建购物清單、点餐、控制车辆等等。Echo可以被设臵为对2个“唤醒”名字中的一个做出响应分别是“Alexa”以及“Amazon”。用户必须在每次请求前加上相应的喚醒词才可以命令设备Echo对于命令的辨识率非常高,用户可以按照自己的语言习惯发布命令而不需要刻意简化命令的措辞。比如说“Alexa峩想打开房间的灯”,Echo在几秒之后就会执行命令

为保证语音识别的效率,Echo采用的是6+1麦克风阵列麦克风阵列是放臵在空间中不同位臵的哆个麦克风。根据声波传导理论利用多个麦克风收集到的信号可以将某一方向传来的声音增强或抑制。利用这种方法麦克风阵列可以將噪声环境中特定声音信号有效的增强。由于麦克风阵列技术具有很好的抑制噪声和语音增强的能力又不需要麦克风时刻指向声源方向。

1.2.Echo在北美大受欢迎销量超过市场预期

Echo最初只针对亚马逊prime用户推出,后来才逐步推向市场随着Echo的市场化,Echo的销量急速上升2015年Echo占据了音響市场25%的份额。并且在整个智能家居市场Echo也已经成为了最火热的产品。根据CIRP的报告自2014年11月发布到2017年1月,亚马逊Echo系列(包括Echo、EchoDot和Tap)用户巳达到820万同比增长2倍,较2016年11月时的数据增长60%而公司2017年的销量目标是1000万。销量激增的背后是Echo正迅速从早期用户的小众圈子进入大众市场

在销量激增的同时,用户对于Echo系列产品的认知度也大幅提升根据CIRP的数据显示,2015年3月公众对于Echo设备的认知率为20%,而到了2016年9月用户对於Echo的认知率超过了69%。

在亚马逊的官网上我们可以看到购买用户对于所买产品的评价。Echo产品的平均得分在4.4/5有85%的用户打分在4星以上。这也從侧面显示了用户对于Echo系列产品的认可

1.4.为什么Echo在欧美那么火

从期初的默默无闻到成为现在市场上最火热的产品,我们认为Echo成功的原因主偠有以下几点:

采用语音交互的方法打造产品语音交互是最新一代的交互形式。苹果、谷歌就已经很早在自身手机智能语音系统平台上咘局语音交互相比于苹果、谷歌手机智能语音系统的多种交互方式并存,Echo则只供了语音交互一种方式并且保持了很好的用户粘性。

定位于家庭Echo最初定位与家庭是语音交互的天然使用场景。在办公或者公共环境下基于安静或者安全的考虑,往往很难使用语音交互但昰在家庭中,用户则会毫无阻碍的使用语音交互并且,Echo只有语音交互一种模式正好培养了用户习惯以及用户粘性。

Echo以音乐为突破口滿足用户生活需求。Echo以智能音响的方式出现正好贴合了用户生活中的使用需求。智能音响市场保持快速增长增速是手机智能语音系统嘚三倍。并且智能音响行业并没有手机智能语音系统行业中像谷歌、苹果那样的巨头IDC报告指出,2014年全球无线音响市场规模为69亿美元到叻2022年,这一数字将达到385亿美元

系统开放带来更多的第三方应用。Echo早早的开放了自己的语音系统使其更多的作为第一个平台搭载更多不哃的功能。Echo目标将自己打造为一个平台而不仅仅是一个智能音响设备。根据CIRP对Echo用户的统计显示只有40%的用户用它来播放音乐,有1/3的用户鼡它来查询信息或者回答问题同时有10%的用户用来控制家电,并且越来越多的用户正在使用智能音响来链接和控制家中的设备

语音作为Echo嘚唯一交互方式,背后是由亚马逊开发的Alexa智能语音助理作为技术支撑Alexa预装在Echo内部,可以接受语音指令Alexa就是亚马逊版的Siri,主要分为语音識别和语音合成两个环节语音识别主要由信号处理、声学模型、解码器和后处理。将从麦克风收集来的声音进行一些信号处理,将语喑信号转化到频域从每10毫秒的语音中提出一个特征向量,提供给后面的声学模型声学模型负责把音频分类成不同的音素。接下来就是解码器可以得出概率最高一串词串,最后一步是后处理就是把单词组合成容易读取的文本。

Alexa语音合成步骤一般为:第一步将文本规范化。第二步把字素转换成音素,由此得到音素串第三步是关键的一步,也是最难的一步就是将音素生成波形,也就是真正的声音最后,就可以把音频播放出来了亚马逊使用了数小时人的自然发音音频,然后将其切割成非常小的片段由此组成一个数据库。最终語音整合起来时调用数据库音频使得声音效果相对较好

2015年6月,亚马逊宣布将Alexa开放给第三方开发者并且围绕平台建设投入大量资金。Alexa发咘了AlexaSkillKit(ASK)和AlexaVoiceService(AVS)两套工具更好的方便第三方开发者使用Alexa,也加快了Alexa的平台建设

AVS是指可集成Alexa的API到其他嵌入式设备中。如果智能设备制造商的产品拥有扬声器和麦克风就可以通过简单的开发将Alexa语音驱动添加至产品中,产品用户即可通过麦克风和扬声器与Alexa的实时语音互动

ASK昰指产品可被集成AlexaVoiceService的设备所控制,能够快速便捷的使产品成为“workwithAlexa”的一部分同时可通过开发让Alexa拥有更多交互功能,并将其加入智能设备Φ所有的这些操作都可在云端进行。

亚马逊将Alexa(Echo)具有的第三方开发的功能称之为技能由于亚马逊开放平台的特点,现在Echo所掌握的技能从2015年的130多项增长到了目前的10000多项同时,也推动了各大硬件厂商争相开发搭载Echo智能语音系统的智能设备

在2017年国际电子消费展(CES)上,雖然亚马逊没有参展但是依然是大会最受瞩目的公司。Echo也是最受大家关注的产品众多参展厂商纷纷推出搭载Alexa的智能设备。比如说华为嘚Mate9LG的HubRobot,惠而浦的洗衣机、电冰箱等

2.为何巨头都在布局智能语音?

2.1.IT巨头新风向:智能语音

在智能语音系统行业中Nuance曾经是行业中绝对的龍头。但如今各大IT巨头都已着力布局自己的智能语音产品。苹果早在iPhone4S时代便推出了搭载在手机智能语音系统平台上的语音系统Siri谷歌很早推出了语音服务系统GoogleNow,最近又推出了带有智能语音设备的家居产品Googlehome并且发布了语音助手GoogleAssistant。微软推出了语音系统Cortana、小冰聊天机器人等Facebook吔已经开始测试旗下智能语音助手“MoneyPenny”。国内的各大IT巨头也不甘示弱纷纷进入智能语音行业。百度开发“百度大脑”以及语音服务系统“度秘”阿里的人工智能ET也将语音交互作为重要技能。

2.2.每一个交互时代都有对应的应用形式

随着人工智能的发展和深度学习技术的使鼡,语音识别准确率已经达到了95%以上计算机和智能终端的界面正在从“键盘+鼠标”变为“麦克风+按钮”,也就是自然语言入口的方式這种转变实际上是交互模式的变革。

交互模式的变革贯穿了整个IT产业的发展史交互模式的转变直接体现在输入输出的形式上。从最初的鍵盘交互时代以DOS命令形式输入为主;随着苹果和微软PC图形界面的诞生,进入了“鼠标+键盘”时代开始通过图形界面(GUI)进行输入输出。2007年乔布斯推出的iPhone手机智能语音系统重新定义了手机智能语音系统,也将计算机带入了移动互联网触屏交互时代直到现在,用户绝大蔀分的交互方式都是通过手机智能语音系统app产生的现如今,聊天机器人的出现则标志着自然语言交互时代的开始Nuance公司首席科学家卡普蘭认为:“图形用户界面已经到达极限,现在已经处于超载的边缘”而新的交互时代就是为了让用户从纷繁复杂的界面窗口、工具栏以忣菜单选项中解脱出来,和终端设备建立便捷、高效的联系

2.3.交互时代的变革往往是重新建立生态、弯道超车的机会

每一次交互模式的变革都是IT产业的一次重新洗牌。微软GUI操作系统Windows3.0的出现一扫之前windows系统销售的阴霾前两个月便销售300万套,奠定了微软操作系统的行业地位网景浏览器的推出彻底将大众带入了互联网世界,而苹果iPhone的出现结束了诺基亚、摩托罗拉手机智能语音系统的市场地位两家曾经的手机智能语音系统巨头分别于2014年4月和2011年8月被微软以及谷歌收购。

新一代交互革命是随着智能硬件的普及而掀起的在即将到来的人工智能时代,語音是最受投资人看好的交互方式VetureBeat在去年6月22日调查发现,AI创始人和高管普遍认为未来5年内最先爆发的AI应用就是聊天机器人平台聊天平囼主要具有以下几点优势:

1、聊天平台超强的用户时间粘性使得在聊天场景其中增加一些服务功能符合用户体验便捷化的方向,而微信最早通过公众号发现用户并不反感聊天应用程序加入服务功能;BIIntelligence数据显示现在4大聊天应用程序的月活跃度已经超过4大社交网络应用

2、iOS和Android平囼上的应用程序开发已经饱和,用户需求的本质并非APP的形式而是其背后的服务越来越多的开发者首选公众号或者语音助手作为其首选的應用服务形式;

3、相对于传统APP机械被动的交互方式,语音更符合人类自然交互的习惯而聊天机器人可以贴近人们对话的情境做出主动服務,也能给用户更加及时的反馈随着语音图像识别、自然语言理解等人工智能技术的进步,这种体验将愈发完善;

4、对于各大巨头来说這是摆脱苹果和安卓商店生态的绝佳机会竞相在聊天平台中打造第三方应用生态,客观上加快了这一趋势的形成

微软公司专注新的人機交互革命,此次核心变革就是“对话及平台”(CaaP)此前,前微软全球执行副总裁陆奇表示:每一次信息科技的大时代都伴随着交互的革命第一次,是当个人电脑崛起时图形用户界面成为用户交互的接口。那个时代的推动者以微软、苹果为代表第二次,当互联网崛起时人们开始通过搜索引擎和浏览器与世界连接。谷歌成为了第二个时代的代表而真正的第三个大时代,是人工智能的时代而它的核心革命,就是“对话即平台”的崛起(ConversationsasaPlatform(CaaP))未来人工智能的方向是能够实现人机自然交互,通过语音、图像而不再是文字、手机智能语音系统键盘作为输入口真正实现CaaP。届时CaaP将会处于后台,通过人机自然交互以此来获取服务。它真正体现在你的面前就是在各個细分领域里的实用产品,比如说无人驾驶的汽车或者是能够智能决策的电商类产品。

3.智能语音产业完备未来互联网新“操作系统”

3.1.丅一个风口:智能语音技术

智能语音技术快速发展。语音技术经过几代科学家几十年的改善研究随着近几年神经网络技术(ANN、DNN)的使用,语音技术准确率得到了质的提升也使得语音技术能够为人类所用。

智能语音技术按照发展可以分为四个阶段:20世纪50-70年代是技术萌芽阶段贝尔实验室、普林斯顿大学等科研机构做了大量的研究,开发了很多技术;20世纪80年代是技术突破阶段随后直至20世纪初,智能语音进叺产业化阶段各个智能语音项目开始产业化运营;2010年至今是快速应用阶段,智能语音技术已经深入用户生活之中苹果的Siri、谷歌的语音搜索、亚马逊的Echo都已经积累了庞大的用户群体。

智能语音的系统框架包含5个模块语音识别模块负责接受用户的语音输入并且将其转成文芓交给自然语言理解模块。自然语言理解模块在理解了用户输入的语义之后将特定的表达输入对话管理模块中对话管理模块负责协调各個模块的调用以及维护当前对话状态,并将特定的回复方式交由自然语言生成模块进行处理自然语言生成模块生成特定回复文本输入语喑合成模块。语音合成模块负责将文字以语音的方式输出给用户

智能语音技术日趋成熟,识别率从量变到质变智能语音识别的准确率穩步增长,从过去的70%提升到现在90%以上2016年11月,百度、科大讯飞、搜狗几乎同时宣布自己的语音设备识别率超过了97%前百度首席科学家吴恩達认为语音识别在此基础下仍然具有很大的潜力。如果智能语音识别率达到99%对于行业而言是质的变化用户将会从偶尔使用到常常使用到哽加自然。99%的成功率将会彻底改变交互方式

3.2.语音交互解决长尾APP入口问题。

智能语音能够解决应用程序弊端互联网时代到来之后,应用程序成为了硬件终端必备不同的应用程序面向不同的用户,针对不同的需求互联网逐渐走向“碎片化”,互联网入口变得极为分散哃时对于用户而言,每天要面对大量的应用程序有需求的时候,打开一个程序需求改变时又要打开另外一个程序。而智能语音的出现囸好可以将分散的入口整合起来而用户也不需要在纠结于繁多的应用程序。

我们以手机智能语音系统为例看看智能语音如何成为移动互联网新入口。移动应用分割用户需求的弊端导致了智能手机智能语音系统上总是停留了很多使用率非常低的应用程序雅虎通过Aviate智能平囼得到的数据显示,平均每名Android用户在手机智能语音系统上安装95款应用程序每天使用的应用仅有35款,其余60款则为“长尾应用”——平时很尐用到某些时刻又需要它,所以一般情况下用户也不会卸载这些App2015年,第三方数据服务提供商TalkingData发布《10亿说:行业精细发展O2O热度空前》嘚分析报告显示,全国平均每部移动设备上安装了34款应用同时,每部设备上平均每天打开应用20款

艾瑞咨询数据显示,移动App的生命周期岼均只有十个月85%的用户会在一个月内将其下载的应用程序从手机智能语音系统中删除。而5个月后应用程序的留存率只有5%。根据友盟数據显示25%移动app在用户使用过一次之后就不在使用了,用户使用超过10次的app只占25%

语音交互的“allinone”特点恰能解决这个问题。智能语音识别和生荿技术相当于给移动终端装上了嘴巴和耳朵语义理解相当于移动终端的大脑。智能语音技术的应用相当于给手机智能语音系统终端搭建叻一个平台装载了所有终端所需要使用的功能。让用户从繁多的手机智能语音系统APP中解放出来

3.3.智能语音设备快速普及,用户渗透率快速增加

智能语音用户普及率现在快速提升在美国,目前手机智能语音系统用户使用语音助手的使用比例已经从2013年的30%左右快速攀升至2015年的60%鉯上渗透率快速提升一倍以上。于此同时16年,谷歌搜索的语音搜索数量较2008年增加35倍以上较2010年增加7倍以上。随着语音识别近年来的突破性进展相关商业应用已经展开。根据百度披露数据自2014年Q2以来语音输入增长4倍以上,语音输出增长26倍以上

智能语音硬件设备销量迅猛增长。Voicelab数据显示在美国市场,2015、2016年语音硬件设备的销售量分别为150万和650万台同比增长330%,预计2017年将2450万同比增长277%。目前国际市场上的語音硬件设备主要来自亚马逊和谷歌。未来苹果和微软也将分别在Airpods、TV和办公、日程类行业发力。

各大公司加快了智能语音技术的开发對比AppStore和Facebook的聊天机器人平台,我们可以发现在第三个月到第六个月,聊天机器人的数量同比增长了约170%而同期App数量只增加了100%。聊天机器人嘚发展速度已经超越了App同样可以对比两个行业活跃开发者数量对比。聊天机器人开发者的人数现在远远大于移动应用开发者的人数在岼台问世的第六个月的聊天机器人的活跃开发者人数是第14个月应用开发人数近3倍。

智能语音产业规模快速增长在各国政府、相关行业及資本界的持续关注之下,智能语音产业得到迅速发展一方面,中国、美国、日本等国家及组织积极布局通过政策引导推动智能语音关鍵技术的研究和产业化。另一方面语音技术厂商和IT巨头大力布局,带动全球智能语音产业规模进一步提升据中国语音产业联盟监测数據显示,2014年全球智能语音市场规模整体达到45.6亿美元,与2013年的33.7亿美元同比增长35.3%2017年,全球智能语音市场规模预计将达到105亿美元较2016年增长30%。

2015年中国智能语音产业规模达到40.3亿元较2014年增长41.0%,2016年中国语音产业规模达到59亿元预计2017年中国语音产业规模将超过100亿元。远远高于全球市場增速

3.4.智能语音产业链完善,巨头打造生态平台

智能语音产业链完善主要有核心技术开发、知识库提供以及应用、服务三个层面。核惢技术开发主要包括语音交互技术提供商、平台支撑提供商以及人工智能机器人提供商三个部分知识库提供主要是指数据和内容(包括影视、股票、餐饮、旅游等)提供商。应用、服务主要包括智能家居、个人语音助手、车载设备、可穿戴设备等平台

亚马逊Alexa之后,世界電子各大巨头公司也纷纷围绕智能语音打造新的平台谷歌、微软、Siri已经先后开放自身的语音平台。

2015年12月科大讯飞发布一整套的语音交互解决方案AIUI。AIUI集成了科大讯飞在双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和内容服务等技术和服务该技術的核心是智能化的多轮对话管理和上下文理解。AIUI相当于科大讯飞定义的语音交互的标准科大讯飞将语音识别、对语音的思考理解贯穿起来,AIUI就是一套软硬一体的模块方案针对聊天机器人,AIUI可以做聊天机器人的场景定制还可以做一些智能家居服务的定制。

3.5.中国智能语喑技术蓬勃发展

论文、专利数量快速增长伴随着人工智能技术的飞速发展,中国在人工智能核心技术——深度学习环节的论文数量以及論文引用量已经位列世界第一而中国在智能语音技术专利数量方面也在逐年增加,2013、2014年每年的专利数量大约在700件左右

庞大的用户群基礎以及互联网系统优势明显,国内公司已经占据一席之地国内用户群数量巨大,互联网用户群体稳定在10亿以上结合国内互联网近10年来飛速发展形成的规模优势以及高效的人才和资金制度,国内在智能语音行业诞生了一批明星公司并且掌握核心算法技术,准确率都已在90%鉯上国内语音公司领跑者科大讯飞旗下讯飞智能语音与人工智能平台为包括QQ、高德地图、滴滴出行、携程、大众点评、新浪微博等在内嘚13万+合作伙伴提供服务,覆盖终端用户数超过7亿在线日服务量达15亿次。目前为止国际智能语音市场,Nuance、谷歌、苹果、微软以及科大讯飛分别占有31.6%、28.4%、15.4%、8.1%以及4.5%的市场份额科大讯飞已经超越老牌计算机巨头IBM位列全球第五。

目前中国语音市场主要份额由科大讯飞、百度、蘋果占据。三家公司分别占据了44.2%、27.8%和6.9%的市场份额在2015年宝马举行的全球语音识别大赛中,科大讯飞排名第一

4.智能语音加速各大行业革新,切入行业核心模块

智能语音系统能够快速切入各个场景进而影响整个行业变革。智能语音产业链可以分为基础层、技术支持层、场景應用层三个层面基础层就是各个人工智能公司研发的语音技术。语音技术的开发需要顶尖的技术团队、海量数据来源、超大的计算量偠同时实现的难度非常大,所以智能语音技术通常只会掌握在几个行业巨头手中技术支持层则是各大公司将智能语音用于一个场景或者領域,往往会和传统行业联系起来比如前文提到的Echo就是亚马逊将语音技术和音响结合应用于家居行业。类似的还有百度“度秘”机器人、苹果Siri等等应用层就是语音交互技术应用到各个行业,改进行业流程促进行业变革。

4.1.Echo核心应用场景——智能家居

Echo音响是实现智能家居嘚重要组成部分Echo音响作为第三方平台已经拥有了超过10000项“技能”,包括安全、娱乐、饮食、健康等等这些“技能”很多是用户日常生活中必不可少的部分。Echo音响正在成为一个装载整个智能家居的平台Echo利用自己的语音交互入口将之前分散的家电、移动设备整合成了一个囿机的整体。随着技术的发展智能家居的入口将由现在的被动输入转化为以智能语音交互为代表的主动捕捉用户需求的方式。届时Echo就囿望成智能家居的入口和中控平台。

智能家居行业高速发展用户渗透率快速增长。到2019年智慧家庭的渗透率预计将达到12%,市场规模超过1500億美元

各大IT公司争夺智能家居入口。在亚马逊Echo以及Alexa之后谷歌推出GoogleHome,科大讯飞也携手京东商城推出叮咚音响意图抢占未来智能家居入ロ。Home是一款智能语音助手音箱注重音乐娱乐和语音搜索,还可以成为家庭智能设备的控制中心Home集成了谷歌最新的助手功能,对于用户來说他们可以储存谷歌服务比如Gmail和Galendar上的大量数据,实现设备间数据同步Home不仅仅是单纯的语音命令系统,而且加入了一定的人工智能、鉮经网络特性不仅能够听懂用户在说什么,还能够实现互动式的交谈它可以和之前推出的Chromecast联动,并且谷歌外观可以个性化定制国内嘚小米公司也推出米家商城,着力打造智能硬件设备管理平台

科大讯飞在音响上的尝试比亚马逊更早。早在Echo推出之前科大讯飞就曝光叻一款智能音响。通过音箱上的一枚语音按钮来实现点歌服务同时这款产品的研发也是获得了中国移动的支持。音乐服务接入了是移动咪咕音乐在此之后,科大讯飞和京东合作推出了Echo相似的产品——DingDong音响。

DingDong音响更加侧重于给“音响”升级和Echo重点打造智能语音平台不哃,DingDong音响目前更加注重于提升传统音响厂商的“智商”2016年4月7日,京东和十几家传统音箱厂商成立“智能音频联盟”在产品中加入DingDong的模組,给音箱配备“大脑”第一个推出产品的是哈曼旗下的JBL。它们基于在售的便携式蓝牙音箱JBLGO做了“升级”加入灵隆科技提供的智能模塊和语音按键,变成支持Wi-Fi连接和语音交互的智能音箱

DingDong音响的交互水平获用户肯定,未来前景可期DingDong可以独立连接WiFi播放网络音乐。叮咚顶蔀配有8个麦克风运用创新的多麦克风Beam-forming技术来定位音源位臵,确保它可以听清用户的每一句话而且有效距离达到5米,加上多声道回声消除技术即使在播放音乐或者在噪音环境下也能识别用户的语音。数据显示截止2017年2月,叮咚智能音箱的整体销售同比去年增长137%以2016年双11當日为例,叮咚智能音箱在京东平台上智能音箱品类里销量排名第一并且超过第二到第十名的销量之和。

4.2.聊天机器人——智能语音最直接的载体

智能语音交互最直接的应用便是体现在人机对话中人机对话的模式主要可以分成两种:1)以快速结束人机对话为目标;2)以尽鈳能延续人机对话为目标。第一种模式是现在语音助手广泛采取的方法主要以命令执行和信息查询为主。第二种模式则是以闲聊为主的聊天机器人模式两种模式的主要区别如下表所示。今后的聊天机器人将会是两种模式的融合既可以完成用户发号的指令,又可以和用戶建立多轮对话充当机器伴侣。

聊天机器人可以很好的优化用户体验的流程提高传统行业效率。以客服行业为例在一个比较复杂的狀况下,用户需要频繁的在指引下按动一系列的按键并且频繁和客服人员解释需求以及更换客服专员。而聊天机器人只要语音输入需求僦可以理解用户真实需求并且返回解决方案

聊天机器人从交互方式改变,提高效率主要原因在于:

聊天机器人提供了一种标准化的方式连接用户,从而降低了用户体验时的复杂性

聊天机器人使企业可以对个人信息进行自动验证,而不再需要繁琐的账户查询或信用卡信息验证过程

使用聊天机器人不再会有“转接”发生。如果需要连接另一位专家这种转接可以在后台无缝对接。

现在大部分信息对话都圍绕着互联网发生聊天机器人可以用网络链接和多媒体来传输信息,而不是只靠声音

VentureBeat报告指出该领域已经吸引了40亿美元的投资。聊天機器人依托于自1950年起的规划发展以及近来人工智能技术的快速发展已经形成了完整的产业链在通讯应用、聊天机器人开发者架构和工具、带有特定领域专业技能的人工智能工具、分析工具(聊天机器人仪表化与追踪)、发现(早期的聊天机器人商店)、支付、安全等共享垺务方面已经涌现出数百家公司。

聊天机器人场景应用层出不穷其中在客服、娱乐、教育、智能问答场景应用最受瞩目。这些行业的特殊性在于其场景相对而言比较专一聊天机器人更容易精准定位。

在线客服聊天机器人系统的主要功能是同用户进行基本沟通并自动回复鼡户有关产品或服务的问题以实现降低企业客服运营成本、提升用户体验的目的。其应用场景通常为网站首页和手机智能语音系统终端代表性的商用系统有小I机器人、京东的JIMI客服机器人等。用户可以通过与JIMI聊天了解商品的具体信息以及反馈购物中存在的问题等并且,JIMI具备一定的拒识能力即能够知道自己不能回答用户的哪些问题以及何时应该转向人工客服。

娱乐场景下聊天机器人系统的主要功能是同鼡户进行开放主题的对话从而实现对用户的精神陪伴、情感慰藉和心理疏导等作用,其应用场景通常为社交媒体、儿童玩具等代表性嘚系统如微软“小冰”、微信“小微”、“小黄鸡”、“爱情玩偶”等。其中微软“小冰”和微信“小微”除了能够与用户进行开放主题嘚聊天之外还能提供特定主题的服务,如天气预报和生活常识等

应用于教育场景下的聊天机器人系统根据教育的内容不同包括构建交互式的语言使用环境,帮助用户学习某种语言;在学习某项专业技能中指导用户逐步深入地学习并掌握该技能;在用户的特定年龄阶段,帮助用户进行某种知识的辅助学习等其应用场景通常为具备人机交互功能的学习、培训类软件以及智能玩具等。这里以科大讯飞的开惢熊宝(具备移动终端应用软件和实体型玩具两种形态)为例“熊宝”可以通过语音对话的形式辅助儿童学习唐诗、宋词以及回答简单嘚常识性问题等。

智能问答类的聊天机器人主要功能包括回答用户以自然语言形式提出的事实型问题和需要计算和逻辑推理型的问题以達到直接满足用户的信息需求及辅助用户进行决策的目的。其应用场景通常作为问答服务整合到聊天机器人系统中典型的智能问答系统除了IBMWatson之外,还有WolframAlpha和Magi后两者都是基于结构化知识库的问答系统,且分别仅支持英文和中文的问答

聊天机器人的下一站——个人助理。和智能语音交互在特定场景应用不同的是个人助手要求聊天机器人能够集合所有场景并且准确理解用户真是语义,判断用户真实需求个囚助理类应用主要通过语音或文字与聊天机器人系统进行交互,实现个人事务的查询及代办功能其应用场景通常为便携式移动终端设备。Siri便是苹果针对个人手机智能语音系统助手的布局和Siri目前依旧以聊天为主不同,百度2016年推出自己的个人助理“度秘”度秘的定位是为鼡户提供私人化的生活服务搜索服务功能。百度把度秘作为一个新式人工智能O2O服务搜索超级入口代替诸多看电影、吃饭、打车、旅游等等的APP应用,旨在简化用户找寻服务的流程、优化使用体验同类型产品还有“Magic”、哆啦HD、应应、Get一下、神猪和助理来也等同类型产品。

4.3.智能语音技术切入教育行业核心业务

现在有多家企业正在将智能语音应用到教育之中智能语音技术在口语教学、考试测评、模拟练习等环節能够代替现在很多老师的工作,大大降低人工成本2017年上海春季高考外语听说测试就将采用语音输入的人机对话的考核方式。以智能语喑为突破口人工智能可以将教育行业,教学、科研、考试、评估等教育各个环节学校、学生、教育监管部门各个场景融合,打造一个智能化教育生态系统

以国内智能语音技术代表科大讯飞为代表我们看一下智能语音在教育行业中的使用以及布局情况。科大讯飞在教育領域动作频频先后并购启明科技,乐知行2016年科大讯飞和新东方成立合资公司,专攻智能语音识别口语和作文批改

科大讯飞已经构建起可持续运营的教育教学生态体系,以及完善的面向国家、省市、区县、学校、家庭的智慧教育产品体系实现了教学主业务流程的场景铨覆盖、终端全覆盖、数据全贯通。

科大讯飞智慧教育整体解决方案包含“考、评、教、学、管”全产品覆盖讯飞畅言智慧教育整体解決方案集教育资源公共服务与教育管理公共服务于一体,横向融合教学、学习、教研、评价、考试、管理等多个环节纵向贯穿各级平台應用,满足各级教育行政部门、学校、教师、学生群体的常态化教育教学和管理需要推动信息技术与教育全面深度融合,提升教与学的效率和效果促进教学、学习和管理方式创新,提高教育质量和学生综合素养推进区域教育统筹均衡与公平,提升区域教育信息化整体沝平智慧校园解决方案通过系统化改进教与学形态、改善学校综合管理和服务环境,使教学与管理业务从流程优化到流程再造构建智能化、一体化、绿色安全的校园生活、学习、工作生态,全面提升学校的信息化应用能力和教学服务水平

科大讯飞在考试领域的布局进┅步扩大。目前普通话考试在全国实现全面机测;广东、江苏、上海、重庆、山东等10余省市的中高考英语听说考试中全年累计机测考生數近1000万;基于“讯飞超脑”计划成果的中英文作文评分技术取得应用突破,并在部分省市的初高中毕业会考中开始应用

科大讯飞拓展C端愙户,智学网打造个人教学平台科大讯飞智学网面向学生的个性化教与学平台,全国范围内已经与近百个地市/区县签订长期服务协议公司智学网已在全国32个省级行政区超过10000所学校使用,受益师生超过1500万人并构建起了全国规模最大、体系最全、配臵最灵活的云测评大数據分析平台,全国最大的试卷资源汇集和加工体系全面实现了教学、考试、测验、练习和作业等教与学过程性动态大数据的常态化采集囷分析,以及个性化学习推荐

4.4.构筑车载交互入口

目前语音交互功能已经成为高档车辆的标配,主要功能包括语音打电话以及语音指令、語音导航系统、语音上网等等

相比于自动驾驶技术,语音交互系统更快渗透进入各大汽车厂商福特的SYNC、通用的OnStar、丰田G-BOOK、上汽的inkaNet等都已經逐渐使用。除了传统汽车厂商IT公司也纷纷进入汽车智能语音行业。2014年1月谷歌在美国国际消费性电子展览会上,宣布与通用、本田、奧迪和现代共同成立“开放汽车联盟(OOAOpenAutomotiveAlliance)”,旨在将其开源系统Android应用于汽车领域3月,苹果公司在日内瓦车展上公布了智能车载系统CarPlay可以與法拉利、奔驰和沃尔沃的汽车实现联接。紧接着苹果iOS7操作系统的更新版iOS7.1发布,它可以支持链接CarPlay系统预计搭载谷歌OOA和苹果CarPlay的汽车即将仩市。在中国市场科大讯飞的语音交互已经广泛使用在奥迪、奔驰、宝马、沃尔沃、福特、雷克萨斯以及国内的吉利、江淮、奇瑞、长咹等品牌中。相比于无人驾驶等技术已经在手机智能语音系统、音响等终端广泛使用的智能语音技术能够更加快速的使用用车辆之中。

4.5.融入芯片加速规模化应用成为产业趋势

以芯片嵌入的形式能够将智能语音更快速而广泛地应用到更多场景中。2016年10月份Intel与科大讯飞宣布匼作共同研发AI芯片,该芯片将麦克风阵列、远场语音识别等功能集成到SOC当中形成完整的远场语音交互链条,此次合作正式宣告Intel也将进入智能语音交互市场

2017年4月9日,科大讯飞宣布与珠海全志科技股份有限公司正式签订战略合作协议共同探索人工智能与汽车产业的融合发展。双方将在车联网硬件平台、语音识别、语音测试等领域展开全面合作并建立联合实验室,在人工智能深度学习领域进行研究全志科技作为国内领先的智能应用处理器SoC和智能模拟芯片设计厂商,在超高清视频编解码、高性能CPU/GPU多核整合等方面业界领先是车联网、智能硬件、虚拟现实、平板电脑、高清视频、移动互联网设备以及智能电源管理等市场领域的主流供应商之一。此次强强联合是讯飞在芯片领域的又一次合作布局

2017年3月30日下午百度联合ARM、紫光展锐和汉枫电子发布DuerOS智慧芯片,围绕成本、性能和易用性等方面打造一站式智能语音交互解决方案据百度度秘事业部首席技术官朱凯华介绍,DuerOS智慧芯片拥有低成本芯片和模组将自带DuerOS,可以放在任何硬件中

“算法+芯片”昰将人工智能与硬件设备一体化方面的新探索,即让语音产品以芯片嵌入的形式能够更加快速而广泛地应用到更多场景中。实际上这种案例在人工智能其他领域也层出不穷例如地平线和ARM成立OPENAILAB以及近期近英特尔153亿美元Mobileye,都是“算法+芯片”的产业方向案例

5.科大讯飞:语音產业的龙头,人工智能的国家队

打造智能音箱平台自然语言交互有望成为下一个入口。公司定位于家庭智控中心的叮咚音箱销量保持增長已经与JBL等多家知名音箱品牌厂商推出合作产品,并正式启动开放平台战略与滴滴出行、中通快递、e袋洗、百度地图、京东到家等合莋,满足家庭场景下从生活服务到出行等多样化需求共同打造智能语音的家庭服务入口。

智慧课堂产品有望成为教育行业新的业绩增长極公司智学网已在全国32个省级行政区超过10000所学校使用,受益师生超过1500万人在全国超过半数“百强”名校应用;公司面向课堂场景的新┅代智慧课堂产品,依托大数据+人工智能改变了传统课堂的教学流程和方法将教学进程由“先教后学”向“先学后教”和“以学定教”轉变,已经在实现课前课中课后的个性化教学、提升课堂教学效率方面取得了显著成果并于16年8月份启动渠道建设的“1520”战役。目前全国巳经有上千所学校(包括22家百强校)实现了智慧课堂产品的常态化应用2017年智慧课堂产品有望成为教育行业收入的重要增长点。

人工智能技术在多个新兴领域应用落地除了传统应用场景,公司人工智能技术在医疗、安防、广告等多个新兴领域取得成功应用:在医疗行业公司布局智能语音、医学影像、基于认知计算的辅助诊疗系统三大领域在301医院、瑞金医院、北京大学口腔医院、安徽省立医院等20多家医院落地使用;在安防行业,公司基于警务大数据结合感知智能和认知智能技术打造的公安超脑解决方案已经在多个省市产生应用战果警务智能云服务平台在十几个省市公安机关开展试点成效显著,成功入选公安部竞争性遴选类重大科研项目;在广告行业公司已经服务超过50镓广告主和广告代理(4A)公司,成为行业主流的数字广告平台为讯飞人工智能生态系统的流量和数据变现奠定了基础。

投资建议:公司莋为国内语音产业无可争议的龙头各行业人工智能应用突飞猛进,此外完善激励机制后有望进一步释放活力。预计年EPS分别为0.46和0.59元维歭“买入-A”评级,6个月目标价43元

风险提示:毛利率下滑风险,新业务进展不达预期风险

语音技术应用进展不及预期;行业竞争加剧导致毛利率下滑风险。

我要回帖

更多关于 手机智能语音系统 的文章

 

随机推荐