网站大量收购独家精品文档,联系QQ:2885784924

关于语音识别的研究.docVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于语音识别的研究.doc

关于语音识别的研究   摘要:计算机出现和发展,为很多领域带来发展可能。在此之前,模式识别信号处理技术和声学等,仅能够独立研究和使用。而计算机不仅提供了融合平台,也使其得以交互,创造更加出色的功能。本文所研究的语音识别技术,便是通过上述学科实现。语音识别技术,主要应用在医学、交通、军事,工业生产等领域。特别是近年来技术成本降低,民用市场不断扩大,这也对语言识别技术的要求,有了进一步的提升。因此,本文对语音识别进行研究,借助其发展趋势和技术结构的阐述,帮助读者认识该技术。同时希望借助本文的研究,为相关研究者提供一定的理论借鉴。   关键词:语音识别;研究趋势   一、语音识别技术简介   语言是人类的基本功能,也是展现思维、进行沟通的重要载体。而语音,是由人类人体天赋转化下,所形成一种表达方式。在科学视野中,这种天赋的转化,被称之声学表现。然而,不可否认的是,虽然语音仅作为一种“天赋表象”,却是人类目前最为有效的交流手段。   二、语音识别技术的发展历史   科技引入到声音的声学研究,在人类历史上发起较晚,始于上世纪50年代,研究人员才致力于声学和语音学的基本概念。第一次实现研究突破是在1952年,学者AT T Bell在其实验室,进行了一组当前视野来看,并不复杂的实验工作。但最终实现了一个单一发音人,孤立发音10个英文数字的语音识别系统,方法主要是度量每个数字的元音音段的共振峰;1956年,RCA Lab 基于Bell的人的研究基础,寻求另一个方向的实践研究工作,力求识别单一发音的10个不同的音节,同样采用了度量共振峰的方法;1959年,组织University College的研究学者,以谱分析和模板匹配的方式,借助构建音素识别器的理念,实现了识别4个元音和9个辅音;1962年,东京大学相关研究部门,对音素识别器的硬件进行实践性研究工作。以过零率方法分离语音信号的不同部分的识别方式,成为目前较为理想的研究手段之一;1963年,日本NEC Lab对数字进行语音识别技术进行尝试,并获得了相对可靠的研究成果。并创造NEC研究语音识别的模板,由此开创了语音识别技术的新领域。值得注意的是,在近四十年来,语音识别技术并未出现质的突破。但是,上述内容60年代所进行的研究,却成为了支撑人类语言识别技术近半个世纪的基础。而其最为重要的贡献,便是通过理论深度研究,于1969年提出时间归正法。   三、语音识别技术的应用及前景   随着声学研究的发展,语音识别技术已然具备了应用的基础。从现状来看,中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统就更高。随着科学技术的发展,集成电路的应用,帮助以往过度复杂的识别体系,能在更小的空间的内实现。从在西方经济发达国家来看,大量的语音识别产品已经进入市场和服务领域。包括手机等移动电子设备,多配备了相对完善的语音机制。并且盲人所使用的电子设备中的语音识别系统,已经达到了以往的军用标准。用户将借助移动通讯网络,以语音识别的口语对话系统,完成日常生活中,如订购票务、酒店等事宜。据调查统计结果,目前85%以上的使用者,对语音识别信息查询服务系统的功能性、准确性表示满意。由此,也可以进行预测:在未来的十年内,语音识别系统的应用范围将逐渐扩大,而基于各类语言、需求的产品涌现,或借助市场调节机制,有效降低此类系统的应用成本。由此更进一步满足各类语音需求。但是,以当前的技术来看,语音识别系统的局现性,或将成为阻碍其发展的根本原因。   四、语音识别技术的系统结构   不可否认,语音识别系统是复杂的。但是,在人类漫长研究中,不断的归纳和总结,最终找到可以大范围区分的“节点”。由此,帮助语言识别系统的构成更加清晰化。从相关研究发现,一个完整的基于统计的语音识别系统可大致分为两个部分:   1、语音信号预处理与特征提取   语音识别的基本工作特征,在于识别单元的选择,这也是能否获得识别结果的重要基础。然而,对于单元的选择,需要合理的区分各个要素,包括单词(句)、音节和音素三种。在选择适合的要素后,才能够进行后续的识别工作。   单词(句)单元广泛应用于中小词汇语音识别系统,但不太适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂。故此,看似简单识别通道,却因为复杂性降低了时效,最终导致难以准确的完成识别任务。   音节单元是基于我国语言特征,所提出的特殊识别要素。由于汉语言与英语等拉丁语系语种的差异性。我国发展语音识别技术,或难以借助他国成熟经验。但是,由于汉语音节总数为1300余个,其中包括408个无调音节,对比于大量多音节的拉丁语系,汉语言基础上的音节单元要素识别,将具备更高的时效性。这也是我国语音识别技术能够“后发制人”的关键。   音素

您可能关注的文档

文档评论(0)

guan_son + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档