- 0
- 0
- 约6.16千字
- 约 12页
- 2018-12-08 发布于安徽
- 举报
实用标准文案
精彩文档
1 课题研究的背景及意义
国外的语音识别研究工作可以追溯到20世纪50年代ATT贝尔实验室开发的第一个能实现十个英文数字的语音识别系统。我国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别十个元音。直至1973年才由中国科学院声学所开始计算机语音识别。1986年3月我国高科技发展计划(863计划)启动,国家863智能计算机专家组为语音识别技术研究专门立项,每两年举行一次专题会议。现在我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势。国内有不少语音识别系统已研制成功。在孤立字大词汇量语音识别方面,最具代表性的要数92年清华大学电子工程系与中国电子器件公司合作研制成功的THED-919特定人语音识别与理解实时系统。在连续语音识别方面,91年12月四川大学计算机中心在微机上实现了一个主题受限的特定人连续英语---汉语语音翻译演示系统。在非特定人语音识别方面,有清华大学计算机科学与技术系在87年研制的声控电话查号系统并投入实际使用。
随着信息产业的迅速发展,人们倾向于使用高效,快捷,方便的电子产品。语音识别作为人机交互的一项关键领域,具备了实时,方便,快速等特点,在当今科学技术的发展上也有着日益重要的地位。在一些特定的环境或是对于一些特定的人,语音识别可以带来很大的方便。例如,驾驶员在高速行驶的汽车内电话拨号,飞行员在飞行过程中发出必要的命令等,都需要语音识别系统,另外语音识别也给失明者带来很大的帮助。
2 课题任务
探讨基于MATLAB的多个特定人孤立词语音识别的方法,期望在进行端点检测时,能进一步提高识别率。该设计要求采用TW算法。主要任务:
理论分析,提出设计方案;
语音采集;
特征提取,形成训练集;
特定人孤立词语音识别算法的程序实现。
3 基本原理
3.1语音识别的基本原理
语音识别系统本质上是一种模式识别系统,因此它的基本结构与常规模式识别系统一样,包含有特征提取、模式匹配、参考模式库等三个基本单元。图1为语音识别系统的原理框图。
失真测度
失真测度
识别识别结果
识别
识别结果
训练模式匹配 模型库逐帧特征 提取 预处理语音信号
训练
模式匹配
模型库
逐帧特征
提取
预处理
语音信号
图1 语音识别系统的原理框图
根据对说话人发音方式的不同,语音识别研究的内容可以分为孤立词识别系统、连续字语音识别系统及连续语音识别系统。本次毕设研究的是孤立词语音识别。
3.2孤立词语音识别系统的设计
孤立词语音识别系统指人在发音时,以单字的发音方式向语音识别系统输入语音,词语词之间要有足够的时间间隙,以便系统能够检测到始末点。采用这种方式的语音识别系统可以做到很高的识别率。图2为孤立词有语音识别系统的原理框图:
预处理
预处理
特征提取
超音段特征提取
参考模式库
模式识别
训练
后
处
理
器
识
别
结
果
输入语音
图2 孤立词语音识别系统
3.2.1语音信号的采集
Windows 自带了一个录音机程序(简称录音机),通过它可以驱动声卡采集、播放和简单处理语音信号。语音信号的采集可以用麦克风直接录制人的语音,也可以通过音频线或者MIDI 线将收音机、电视机或磁带录机中的语音信号采集到计算机中。在录音机中可以进行简单的声音处理,如加大或降低音量,加速或减速,声音的反转或添加回音效果等。加速或减速的改变可以完成变音功能,反转可以达到对声音文件保密的功能。
通过windows自带的录音器,分别由我和同学录入了2组数据(1人1组),每组10个音频文件,分别为从“零”到“九”的汉语发音。其中一组为参考模板,另外一组为测试模板。
3.2.2端点检测
语音信号录制进来后,不论是识别孤立词还是识别连续词都必须做语音分段,即语音端点检测,找出语音段的开始和结尾,这可借助于语音信号的短时能量和过零率。有声音段的能量值较大,无声音段的过零率较高,因此可以通过计算短时能量大致判断语音的端点,然后使用过零率找到语音端点的相对精确位置,分解出每一个语音段。
整个语音信号的端点检测可以分为四段:静音、过渡段、语音段、结束。系统中使用一个变量来表示当前所处的状态,在静音段,如能量或过零率超过了低门限,则开始标记起始点,进入过渡段。在过渡段,由于参数的数值比较小,不能确信是否处于真正的语音段,因此只要两个参数的数值都回落到低门限以下,就将当前状态恢复到静音状态。如果在过渡段中两个参数的任意一个超过了高门限,就可以确信进入语音段了。
端点检测时,首先根据短时能量进行初步判断,此时对终点的检测已比较准确,但由于大多数声母是清声母,它的能量相当弱,依靠
您可能关注的文档
- 多媒体通信2次阶段作业的答案详解.doc
- 多普勒效应综合的实验的报告材料材料及大数据处理图.doc
- 多元的回归作业的.doc
- 多元的统计分析报告材料方法概述.doc
- 多元的线性回归.doc
- 多元的回归分析报告材料与相关分析报告材料.doc
- 多元的线性回归分析报告材料预测法.doc
- 多元的线性回归分析报告材料地基本思想和方法.doc
- 多元的线性回归习地训练题目答案详解.doc
- 尔雅孙子兵法答案详解.doc
- 2023年07月19日海口市琼山区农业农村局海口市谭仙农产品加工产业园(一期)项目.pdf
- 2023年08月09日陵水黎族自治县城乡投资有限公司陵水县新疾病预防控制中心建设项目.pdf
- 2023年06月09日海南高速公路股份有限公司三亚湾休闲海洋牧场.pdf
- 2023年08月17日中海油田服务海南有限责任公司中海油田服务海南有限责任公司新建使用海上油气测井用放射源及射线装置项目.pdf
- 2023年07月05日海南众智福山精神病医院海南众智福山精神病医院扩建项目.pdf
- 2023年08月31日琼海市农业农村局琼海市长坡青葛港修复工程项目.pdf
- 2023年07月20日海南康牧饲料有限责任公司康牧饲料物流仓储中心及饲料粉粹混合制粒加工项目.pdf
- 2023年06月28日海南省动物疫病预防控制中心海南省动物疫病防控指挥中心项目.pdf
- 2023年08月10日云峡(屯昌)新能源有限公司三峡电能屯昌100MW“光伏+蔬菜”项目.pdf
- 2023年07月28日海南矿业股份有限公司海南矿业股份有限公司选矿实验中心建设项目.pdf
原创力文档

文档评论(0)