- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
鼎铭可编程交换机asr系统中的应用解决方案,可编程交换机,交换机回路怎么解决,交换机环路解决,交换机环路怎么解决,交换机解决方案,北斗鼎铭律师事务所,广西南宁鼎铭教育,鼎铭房产,鼎铭教育
鼎铭可编程交换机在ASR系统中的应用解决方案
ASR业务介绍
ASR,英文的全称是Automated Speech Recognition,即自动语音识别技术,它是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。现在ASR技术主要被用于社会信息服务、PC、手机、车载、玩具五个领域基本上,语音识别是计算机能明了人类说话的语句或命令,而做出相对的反应换言之,如果计算机配置有语音识别的程序,当声音通过一个转换装置输入计算机内部、并以数位方式储存后,语音识别程序便开始以你输入的声音样本与事先储存好的声音样本进行对比工作。声音对比工作完成之后,计算机就会算出数个最匹配、接近的声音样本序号,就可以知道刚才输入的声音是什么意义,进而执行此命令。语音技术的采用,可以突破话机数字键盘的局限,降低录音和坐席成本,实现真正的自助服务。语音识别技术可以解放用户的双手,在开车时、走路时、工作忙碌时,免去按键的不便和繁琐,只要说出需求,一切就可以轻松搞定。正是由于优点,语音技术已经成为西方发达国家通信增值业务中的一个亮点。IVR系统通用的工控机平台上插入语音卡组成,支持中文语音技术。
一个典型的包含ASR服务的电话服务流程可分为:
用户电话拨入,系统IVR响应,并提示用户说出相关语音信息。
IVR系统采集用户的语音信息,并形成于语音样本,把此语音样本送向ASR服务器
ASR服务器将送来的语音样本和服务器内存储的语音样本进行对照分析,并进行匹配。
ASR服务器计算和分析出同采集来的语音样本最匹配的原始语音样本,并调出与该原始语音样本相对应的执行命令信息,将该执行命令信息通过TCP通讯网络送向数据库服务器。
数据库服务器接收到执行命令信息后,数据库服务器调出相应的文件数据,通过TCP通讯接口将该数据发送给IVR服务器。
IVR服务器把数据组装成为独立的语音文件。
IVR服务器播放相应的语音文件给电话用户。
具有ASR功能的电话智能转接系统,一般具有一些下列服务流程:
用户电话拨入,系统IVR响应,并提示用户说出相关语音信息。
IVR系统采集用户的语音信息,并形成于语音样本,把此语音样本送向ASR服务器。
ASR服务器计算和分析出同采集来的语音样本最匹配的原始语音样本,并调出与该原始语音样本相对应的执行命令信息,将该执行命令信息通过TCP通讯网络送向IVR服务器。
IVR服务器将该执行命令信息转换成相应的执行命令,进行二次拨号(可能是内线也可能是外线)。
振铃端用户摘机,双方进行通话。
一些系统综合上面两种服务流程,更全面的利用ASR所带来的智能性和方便性对用户进行服务。
一般的公网接入(IVR)大都采用“工控机+语音板卡”,而采集的语音样本则通过局域网传给ASR服务器。这种结构只适用于简单的应用场合。如果用这种方式去组建较大的系统,则会存在诸多问题:
两个瓶颈
接入瓶颈:
单台工控机的接入容量一般不超过8E1为宜。除了运行应用程序外,它还要控制两个实时端口:实时地通过局域网发送采集到的语音样本,并要实时地将采集到的语音数据通过由语音卡通过PCI(或ISA)总线传递给工控机,如下图所示。
通过局域网传递语音数据本来就不能保证其时实时性,其结果就是用户听到的语音经常断续,保证不了语音质量。如果传递的语音数据是经过压缩的,语音数据本来就是通过TTS进行合成的,再经过压缩,则音质会有很大的损伤,因此同样保证不了语音质量。从上图中我们可以看到,经TTS合成的语音数据从局域网经过网卡,再通过主板PCI(或ISA)总线进入语音卡,最后进入电信网,同样语音数据通过计算机主板经PCI(或ISA)总线进入语音卡也要求是实时的。这两种实时性的要求会导致在接入量比较大的情况下,会给计算机的总线造成很大的负担。因为总线的带宽(数据吞吐量)是有限的。况且其它的板卡和接口(如声卡、显示卡等)也要直接或间接地占用总线。因此在接入量比较大的情况下,计算机的总线带宽会成为一个比较关键的瓶颈。即便提高语音板卡的接入能力。在有大量电话接入的情况下,由于语音数据实时性的要求,也不能保证语音质量。
I/O插槽和语音板卡容量的限制:
目前计算机的I/O插槽,特别是PCI插槽有限,不可能插入大量的语音板卡,再加上语音板卡的容量不会太高,因此单台计算机的接入能力相对较小。要组建比较大的系统,就必须采用多台计算机接入,这就必然会引入机间交换的问题。用语音板卡和多台机器构建大中型CTI系统时,机器间要通过电缆连接才能使系统同步运行,但交换用的时钟同步信号和数据信号的频率很高,极易受到外界干扰,造成系统的不稳定。
系统复杂度的限制
基于语音板卡构建较大规模的应用系统时,除了系统稳定性的因素外,还要考虑系统的复杂度。对
文档评论(0)