网站大量收购独家精品文档,联系QQ:2885784924

数字语音处理技术.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
成绩 课程论文 题 目: 数字语音处理技术 学生姓名: 学生学号: 系 别: 专 业: 年 级: 任课教师: 预处理模板库专家知识 预处理 模板库 专家知识 数字语音处理技术 摘要 近年來,语音识别已经成为一个非常活跃的研究领域。在不远的将來,语音识别技术有 可能作为一种重要的人机交互手段,辅助共至取代传统的键盘、鼠标等输入设备,在个人计 算机上进行文字录入和操作控制。而在智能家电、工业现场控制等其他应用场合,语音识别 技术则有更为广阔的发展前景。 在语音识别屮,最为简单有效的方法是采用DTW(Dynamic Time Warping,动态时间规 整)算法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别 中出现最早、较为经典的一种算法。 一、语音识别系统概述语音识别系统概述语音识别系统概述语音识别系统概述一个完 整特定人语音识别系统的方案框图如图1所示。输入的模拟语音信号首先要进行预处理,包 括预滤波、采样和量化、加窗、端点检测、预加重等,然示是参数特征量的提取。提取的特 征参数满足如下要求: 特征参数能有效地代表语音特征,具有很好的区分性; 参数问有良好的独立性; 特征参数要计算方便,要考虑到语音识别的实时实现。 淹度戶计|H识别j决策}番狞 奏考模板 图1语音识别系统方案框图 语音识别的过程可以被看作模式匹配的过程,模式匹配是指根据一定的准则,使未知模 式与模世库屮的某一个模世获得最佳匹配的过程。模式匹配屮需要丿IJ到的参考模板通过模板 训练获得。在训练阶段,将特征参数进行一定的处理后,为每个词条建立一个模型,保存为 模板库。在识别阶段,语音信号经过相同的通道得到语音特征参数,生成测试模板,与参考 模板进行匹配,将匹配分数最高的参考模板作为识别结果。 二、语音信号的分析与处理 1、语音信号采集 该实验以实验者木人的声音(语音信号0?9)为分析样本,是利用PC机录制,音频文 件采用8000kHz采样频率、16bit量化、单声道的PCM录音格式,用MATLAB木身wavread 函数来读取语音文件。如图2为采集的数字信号“3”的语音原始信号。 图2采集的数字语音“3”的原始信号 2、语音信号分析 语咅信号是一种典型的非平稳信号。对于非平稳信号,它是非周期的,频谱随时间连续 变化,因此由傅里叶变换得到的频谱无法获知其在各个时刻的频谱特也 如果利用加窗的方 法从语音流屮取出其屮一个短断,再进行傅里叶变换,就可以得到该语音的短时谱。 语音信号的基木组成单位是音素。音素可分成“浊音”和“清音”两大类。如果将不存 在语音而只有背景噪声的情况称为“无声”,那么音素可以分成“无声”、“浊音”、“清音” 三类。 浊音的短时谱有两个特点:第一,有明显的周期性起伏结构,这是因为浊音的激励源为 周期脉冲气流;第二,频谱屮明显地有凸出点,即“共振峰”,它们的出现频率与声道的谐 振频率相对应。清音的短时谱则没有这两个特点,它I-分类似于一段随机噪声的频谱。 2」时域分析 语音信号具有时变特性,但在一个短时间范围内(一般认为在10?30ms的短时间内), 其特性基木保持不变,即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有 短时平稳性。任何语音信号的分析和处理必须建立在“短时”的基础上,即进行“短时分析”, 将语音信号分段来分析其特征参数,其屮每一段称为一 “帧”,帧长一般取为10?30ms。这 样,对于整体的语音信号来讲,分析出的是由每一帧特征参数纽?成的特征参数时间序列。 2」」短时能量分析 短时能量分析用途:第一,可以区分清音段和浊音段,因为浊音时的短时平均能量值比 清音时大得多;第二,可以用来区分声母与韵母的分界、无声与有声的分界、连字 的分界等。如对于高信噪比的语音信号,短时平均能量用来区分有无语音。无语音信号噪声 的短时平均能最很小,而有语音信号的能量则显著增大到某一个数值,rti此可以区分语音信 号的开始点或者终止点。 2.1.2短时过零率分析 过零就是信号通过零值。对于连续语音信号,可以考察其时域波形通过时间轴的情况。 对于离散时间信号,如果相邻的取样值改变符号则称为过零。由此可以计算过零数,过零数 就是样木改变符号的次数。单位时间内的过零数称为平均过零数。短时过零分析通常丿I]在端 点侦测,特别是用来估计清音的起始位置和结束位置。 2.2、频域分析 短时傅立叶分析在运用离散时间傅立叶变换分析语音信号的变化时,会遇到这样的问 题,即单一的傅立叶变换并不能反映时间变化的频谱信息,诸如时变共振峰和谐波。具体而 言,通常将信号的每一时刻与其相邻时刻信号的傅立叶变换相联系,这样就可以及时跟踪信 号的频谱变化。语音信号的短时傅立叶变换见稈序所述。短时傅立叶分析一般采用汉明窗作 为分析窗。 3、语音信号的

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档