司机标准化用语识别系统探究.docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
司机标准化用语识别系统探究

司机标准化用语识别系统探究摘 要:由于对语音识别的需要来自不同的领域和部门,因此对语音识别系统应具有的性能和指标提出了差异极大的要求,语音识别系统要根据一定的指标、要求设计,基于车内噪声和语音字数与语音识别率的相对关系展开讨论和研究。 关键词:语音识别系统 语音特征参数提取 动态时间归整 软件模拟 中图分类号:TP39    文献标识码:A     文章编号:1007-3973(2012)006-001-02 1 引言 目前的铁路运行系统中,司机工作呼唤用语种类较多,司机行车过程中呼唤的时机、语句存在种种问题,对行车安全存在隐患,因此需要通过一种系统来对司机的呼唤用语进行规范,使其趋向于标准化,确保司机工作更严谨、专业,进一步确保行车安全。 2 背景 司机标准化用语识别系统作为一项新的技术正在飞速发展。近年来语音识别技术虽然取得了很大成功,但是距离真正的人机自由交流还有很大的距离。近年来,随着人们对安全要求的不断提高,语音识别技术正在日渐完善,则很有必要研究司机标准化用语识别系统,使铁路部门对司机呼唤的考核更为智能化、自动化,为铁路安全保驾护航。 3 识别的的基本结构 3.1 语音识别系统结构 相同的语音识别系统,尽管设计和实现的细节不同,但所采用的基本技术是相似的。一个典型的语音识别系统。主要包括预处理、特征提取和模式匹配。首先是特征提取,把我们的声音转换成电信号,声音的三要素就包含在内,我们要做的是提取部分信息,对其分析进行分析,最后得出结论。这包括了两个过程,首先是训练过程,这是在我们的系统投入引用之前研发阶段做的工作,需要通过训练形成模式参考库,以便模式匹配时使用。其次是识别过程。先介绍一下语音识别系统在火车上的应用。司机身上佩戴一个语音棒,记录司机沿途的口令,到站后,把语音棒插入服务台,那里有我们的语音识别系统,对录音进行识别,它包括司机有没有说口令,说得对不对,还有说的时间对不对,其识别过程是把语音分段,然后进行模式匹配。 根据原理建立数学模型,就可以根据其算法进行编程,进行软件的开发,实现一个性能良好、满足要求的语音识别系统。 3.2 语音识别系统的原理 语音识别系统实质上是一种模式识别系统,与常规模式识别系统一样包括有特征提取、模式匹配、参考模式库等三个基本单元。语音识别的步骤分为三步。第一步是根据识别系统的类型选择一种识别方法,采用语音分析方法分析出这种识别方法所要求的语音特征参数,这些参数作为标准模式由机器存储起来,形成参考模式库。第二步是语音识别的核心,采用选择的语音识别方法进行模式匹配。语音识别核心部分又分别表现为模型的建立、训练和识别三个部分。第三步,语音识别可以进行后处理,后处理通常是一个音字转换过程,有可能包括更高层次的词法、句法和文法处理,另外也有可能作为某个具体的任务语法的输入。 3.3 语音识别算法 语音识别核心部分的作用是实现参数化的语音特征矢量到语音文字符号的映射,我们使用的模型训练是指按照一定的准则,从大量己知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。 要建立一个语音识别系统不仅要提取最能反映语音特征的参数,而且还要一个好的语音识别模型和算法。语音识别是根据模式匹配原则,计算未知语音模式与语音模板库中的每一个模板的距离测度,从而得到最佳的匹配模式。 4 实验过程和数据处理 下面对两款已开发的软件进行试验,通过对比测试来研究哪个软件更适合火车语音识别系统。 4.1 中科信利语音识别引擎测试记录 测试结果: 测试句子:122条。 1次通过:93条,一次通过率:76.2%。 2次通过:23条,二次通过率:95%。 3次通过:6条,三次通过率:100%。 缺点:中科信利语音识别引擎不支持动态识别,只能将要识别的句子或者词语加入到词汇列表中才可以识别,例如句子中的站名、车次、多少公里、多少米等。 4.2 科大讯飞语音识别引擎测试记录 测试结果: 结论:识别长句子效果不佳(尤其是30字以上的句子),但是多识别几遍,最终是可以识别出来的。 测试句子:122条。 1次通过:100条,一次通过率:81.9%。 2次通过:11条,二次通过率:90%。 3次通过:3条, 三次通过率:93.4%。 4次通过:3条,四次通过率:95.9%。 5次通过:1条,五次通过率:96.7%。 未通过:4条(40字以上句子) 通过率:96.7%。 总结:长句子,未读完就停止识别,若不停顿,一口气读完,基本3-4次即可识别出来,凡是含有站名(如成都站)或含有数字(如6道、6调、8线等)的语句站名与数字基本上识别是

您可能关注的文档

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档