自动语音识别技术(ASR)在聋哑儿童计算机辅助教学中的开发与应用.docVIP

下载本文档

10
0
约3.75千字
约 4页
2017-08-25 发布于河南
举报
版权申诉

自动语音识别技术(ASR)在聋哑儿童计算机辅助教学中的开发与应用.doc

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

自动语音识别技术(ASR)在聋哑儿童计算机辅助教学中的开发与应用RDTE OF CAI FOR THE DEAFDUMB CHILDREN BASED ON ASR 一、课题来源及研究的目的和意义；　　据有关机构抽样调查，我国有残疾人约6000万，其中聋哑人约有1300万，18岁以下应受教育的聋哑人约达100万，这是一个庞大的弱势群体。他们在学习、工作和生活上有许多难于想象的艰辛和障碍，在成长和发展的道路上要比常人付出多倍的努力。聋哑儿童的教育是一项充满爱心、充满社会主义人道精神的光辉事业。也是我们整个社会义不容辞的责任。　　欧、美、香港等一些经济发达国家和地区聋教育起步很早、水平很高。在传统的教学方法、教学手段、仪器配备等方面我国与他们差距较大。在现阶段，国内外聋教育、康复机构较注重专用设备的研究和配备，而在现代化教学技术的应用，尤其在网络、计算机、自动语音识别技术等最新科技成果应用方面，我国与国外尚存在着一定的差距，基本上处于起步阶段。事实上，现代信息以及其他科技、医学等领域的新理论、新技术和新设备应用到聋人康复、教育等方面后，必将使世界聋教育的观念发生重大改变，从而也给聋校的教育改革带来巨大的影响，我国的聋教育必须抓住机遇，深入进行改革和创新，努力提高学校的教育质量，跟上时代的步伐。　　在全世界聋哑儿童的教育领域里，从现代教育技术的应用而言，我国与国外的差距不大，这是我国聋教育事业赶超世界水平的难得机遇。本课题率先把现代信息技术、现代教育技术与聋教育的特殊需求相结合，通过将信息技术及软件开发成果应用于聋教育，并对实施对象、实施方法及效果进行研究、对比，总结出符合中国国情的现代教育技术在聋哑儿童教育领域的实施经验。　　本课题旨在利用现代教育技术和手段，基于自动语音识别技术(ASR)，在聋人教育的技术层面上，进行研究、改革、实践，注重培养聋哑儿童学习的兴趣，使其掌握收集、分析和处理信息的能力，掌握自学和终身学习的现代化手段，提高自身素质和适应社会生活的能力，使其能以平等的地位和均等的机会参与社会生活，共享社会物质文化成果。　　二、国内外在该方向的研究现状及分析；　　聋哑人语音训练的研究国外始于六十年代中期，根据反馈途径的不同，大致可以分为两类：利用聋哑人的残存听力借助助听器听取自身发音已纠正发音的听觉反馈训练系统和通过观察CRT上根据自身发音经处理后所获得的特征参数来纠正发音的视觉反馈训练系统。前者造价低，但效果较差。对重听、重度耳聋、全聋的患者效果更差或完全无效。后者由于通过视觉反馈，几乎适用于一切聋哑人，训练效果也较好。在早期研制时视觉反馈系统成分较高，随着计算机和大规模集成电路技术的发展，尤其是语音专用芯片和单片机的出现，成本已大大降低。　　目前，国外已经有多种视觉辅助语音训练系统的报道。这些系统基本上都是将受训者所发语音进行处理后，提取语音的特征（例如：强度、持续时间、频谱、基频、共振峰等），与标准发音的特征同时显示在CRT上，让受训者对自己的发音与标准音进行比较，逐步纠正自己的发音。很遗憾，这种系统所显示的信息对一般的受训者来说太转业了，不易为他们，尤其是聋哑儿童所理解，因此影响了训练效果。这是这类系统的最大缺点。　　至于本课题的重点，自动语音识别研究，开始于五十年代初，当时电子信号频谱分析仪器开始被用于从语音信号中识别简单、少量的音节和音素。随着计算机技术的飞速发展，进入九十年代后，语音识别的研究进一步升温，除了连续语音听写机之外，还出现了诸多实用化的研究方向。IBM公司率先推出的ViaVoice标志着大词汇量、非特定人、连续语音识别技术正趋于成熟。目前，市场上还有很多比较成熟的语音ASR产品，而且他们大多数都支持二次开发，如微软的Speech Application SDK（SASDK）、SUN公司倡导的JavaSpeechAPI、IBM的Dutty++等。他们大部分能识别英语、日语和中文等不同国家的语言，Dutty++甚至能够识别某些地区的方言，如广东的方言－粤语。从整个语音识别研究的发展前景上看，语音识别系统的鲁棒性(Robust)将是未来几年的研究重点之一。因为这是语音识别系统由实验转为实用过程中的一个最为迫切最关键的问题。而针对聋童的自动语音识别系统，将是一个不可忽视的研究重点。　　我国的语音识别研究起步较晚，但由于汉语语音识别的重要性日益突出，最近十年的发展十分迅速。所以相应从九十年代开始的自动语音识别的研究，我国基本可以和国外同步。目前，国内从事这方面研究机构主要有：清华大学、中国科学院声学研究所、中国科学院自动化研究所，香港大学、中国科学技术大学、国防科技大学、北京邮电大学等等。　　三、主要研究内容；　　ASR，英文的全称是Automated Speech