- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本地化硬件语音合成和识别技术在智能家居系统中的应用.pdf
基于硬件的本地化语音交互技术在智能家居系统中的应用
智能家居一直是很多人的梦想,然而它似乎始终停留在科幻电影中,
却从未真正走入过人们的现实生活。
虽然人们家中使用的电器设备从白炽灯变成了 LED 光源,有线电话
变成了智能手机,黑白电视变成了3D 云电视,台式PC 变成了平板电脑,
从电饭锅变成了微波炉,电风扇变成了中央空调,然而对电器的操控方
式却始终是手动开关和红外遥控的老版本,人们的生活方式也并没有太
大的改变。目前已经开发出的智能家居系统几乎都都是针对灯光窗帘门
禁音响进行控制的老套路,除了把一些开关做成触摸式,遥控式,集中
控制面板式,再找不到什么值得一提的亮点。而随着控制系统越来越专
业,操作界面越来越复杂,普通非技术人员特别是老年人接受和使用的
难度相当大,不但没有为生活提供便利,反而成了一种新的负担。好多
老年人面对数字电视接收机遥控器上密密麻麻的一筹莫展。而人机交互
手段的局限,正是这种现象的根本原因。
在人们的日常生活中,语言无疑是最简单的交流工具,它比其他的
感观和行为都更加直接,承载信息量大,传达内容精准,作用距离远,
而且人人都可以运用自如。如果能采用自然语音与智能家居系统进行互
动,无疑是再方便不过了,但这最简单的人机交流手段,从技术上却是
非常难以实现的。
随着软硬件技术和网络技术的飞速发展,数字化语音交互技术终于
走进了人们的现实生活。最具代表性的有基于网络的“云”识别技术和
基于专用硬件电路的纯硬件本地化语音交互技术。
1
基于“云”识别的语音交互技术:
自从Apple 公司发布基于“云”识别的语音交互系统Siri 发布以来,
用自然语言特别是中文与设备进行交互控制成了一个热门话题。移动互
联网领域无疑成了“云”识别的天下,在移动互联网业务中,语音识别
都是通过“云”来进行的。然而“云”识别却有一些严重的缺点:
1、“云”识别的运行依赖于先进的操作系统,昂贵的处理器,复杂
的云端程序,高的网络通信和庞大的云后台服务器系统,实现成本高,
建设难度大;
2、基于“云”识别,要把用户的声音上传到服务器进行处理,如果
要做到随时待命,就意味着用户说的每句话都会被上传到服务器上,而
识别后的语音已经成为文字数据表示,极易被监控,窃听和记录。毫无
隐私和安全可言;
3、云端程序占用系统资源多,空间大,难以在轻量级低成本硬件平
台上实现,体积和造价难以控制;
4、“云”识别完全依赖网络通信,一旦断网便无法运行,在网络难
以接入或移动信号的盲区内无法实现。
基于以上几点,“云”识别非常不适合应用于智能家居系统中。
纯硬件本地化语音交互技术:
近年来,我国的一些高技术公司在语音交互技术领域取得了可喜的
成果,在中文语音合成(TTS)和中文语音识别(ICR)技术方面占得了
市场先机,自主研发出了一大批语音交互软硬件产品,其中最具代表性
的就是北京宇音天下公司推的 SYN 系列中文语音合成芯片和 IC-ROUTE
公司推出的LD 系列中文语音识别芯片。这些国产先进语音芯片的问世,
2
使小体积,低成本,高性能的本地化硬件语音交互控制产品成为可能。
基于这些芯片开发的语音交互控制系统,也就是语音人机交互(VUI)系
统,为中国的智能家居领域提供了非常理想的语音交互控制手段。
基于硬件的本地化语音交互系统有着自己的独特优点:
1、用户的语音指令直接由本地硬件芯片处理,不必上传到网络,语
音内容实时匹配实时刷新,不会被存储和盗用,确保用户的隐私不被侵
犯;
2、系统体积小巧,价格低廉,不占用用户系统的处理器和资源,非
常容易嵌入与整合,可以做到随需安装,随处安装,不易受空间和环境
限制;
3、识别精准迅速,语音清晰自然,操作简便易学;
4、非特定人识别,无须录音训练;多种人声音色,语速音调多变;
关键词表存储,无需海量空间;拼音汉字描述,内容设定简单。
典型的基于硬件本地化语音交互系统主要由语音合成(TTS)电路,
语音识别(ICR)电路,交互脚本引擎和设备控制接口等部分构成。
以下是一些采用语音天下公司的 SYN6288
文档评论(0)