- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
朗读效果排名的话,是这样的(由高至低):
a. neospeech liang
b. 科大讯飞 小燕
c. neospeech lily
d. neospeech hui
e. 科大讯飞 小宇
科大讯飞电话语音识别InterReco——应用开发及工具包
为了方便语音识别系统的开发,InterReco提供了一系列的开发接口和应用工具,从而使得应用系统的开发更加高效,主要包含如下:
一、应用开发接口
·语音识别接口
语音识别接口是InterReco提供的最重要的对外接口,是应用开发人员使用识别引擎进行语音识别开发所必需使用的接口。这个接口提供强大的功能,能够发挥InterReco语音识别系统的优势,通过不同的并发编程模型简化编程复杂度,优化系统性能表现。
·语法接口
语法编译管理接口提供API形式的语法编译和管理的方法,主要用来解决动态语法的编译、加载、激活的过程。用户根据需要使用这些接口可以对自己的应用程序做出恰当的优化,提高应用系统灵活性。语法管理接口允许用户管理和设置语法缓冲的策略。
·端点检测接口
端点检测是语音识别一个重要的输入环节,该接口允许用户通过编程对端点检测的处理策略,和语音识别引擎进行交互。
·音频输入接口
该接口提供一套能够使用户把电话语音输入设备挂接到InterReco语音识别引擎的方法,包含各种品牌的电话语音卡和麦克风。通过这个接口,能够消除输入设备的多样化带来的集成复杂度,使得产品在音频输入方面具备优秀的可扩展性。
·管理维护接口
该接口提供管理维护接口、日志接口、以及其他一些辅助接口。
二、应用优化方法
分析和优化在语音识别的开发、应用过程中扮演非常重要的角色,好的分析和优化工具往往能够决定语音识别的应用是否能够成功。InterReco 2.0中提供的主要分析优化方法有:
·分析识别效果
通过Call-Log纪录,使用分析工具分析统计,得出当前应用的总体识别率、语法内识别率等重要技术指标。这些指标能够反映出当前语音应用的总体识别效果,同时也能够分析应用中存在的问题。
·识别优化
通过识别效果的分析,对识别的语音界面、识别语法、识别模型、系统参数进行优化,以达到提高用户满意度,提升识别效果的目的。
·自适应
分为无监督和有监督的自适应,识别系统在运行过程中会以一定的间隔对当前的应用场景进行一次无监督的声学模型自适应,这种适应的内容包括:说话人特征自适应,包含口音和方言;通道特征自适应,包含无线通道、VoIP编解码通道;应用特征,包含词汇、环境噪声等。
三、工具包
InterReco提供了丰富的开发调试工具,能够在集成开发的过程中为用户提供全面有效的支持。主要包含:
·识别演示程序
识别演示程序是一个基于对话框风格的Windows GUI界面,其主要功能是在Windows环境下,为用户提供一个简便、友好的方式,使得用户能够使用麦克风完成基本识别功能,或者使用离线识别功能,也可以设置一些系统参数验证其效果。
·语法调试分析工具
用户来可以直接用文本而不是实际语音对于自己编写的语法进行分析和调试。主要功能有:输出语法的所有定义范围、测试一个说法是否满足语法要求。
·语法管理工具
管理语法缓存工具,可以使用该工具查看当前InterReco系统语法缓存的详细情况,还可以使用该工具手工删除指定的语法缓存条目,该工具还提供了预先编译语法文件的功能。
·用户词典工具
用户自定义词典工具。通过该工具,可以对输入词条列表生成发音,并保存为用户自定义词典。
这些开发接口和工具包可以帮助合作伙伴更快速的将语音识别产品集成到各中应用系统中,并作为合作伙伴在语音识别业务设计、调试和效果优化等各阶段的技术助手,帮助合作伙伴更快速的开发成功的语音识别应用系统。
科大讯飞5.0语音软件的安装和操作要领
????????? 科大讯飞5.0语音软件(硬盘版),它是目前最好的语音朗读软件,小宇(男声)、小倩(女声)的发音可与真人发音媲美,尤其是小宇(男声)磁性发音效果好,听起来很自然。5.0语音软件操作方便简单,只要把解说词的文本粘贴上去,点合成就可发音读了。下面我就介绍科大语音5.0软件的安装及使用方法。
一、软件大小:
01运行库5.0版(332MB)?? 语音库(可先下载):02小宇(男声)5.0版(1.12GB)?? 03小倩(女声)5.0版(583MB)04小燕(女声)5.0版(1.67GB)? 05小琳(女声)5.0版(137MB)06英语(女声英语)(223M) 07小美(女声粤语)(983M)。
二、安装方法:
1. 安装运行库:用虚拟光驱软件打开或Winrar解压后打开 InterPhonic5.0运行库.iso,点击 Runtime(Demo)_Chinese (PRC).msi 安装即可
2.把 InterPhonic.
文档评论(0)