基于Matlab的说话人识别的设计与开发.doc

下载文档 降价啦

9
0
约1.97万字
约 37页
2019-09-10 发布于江西
举报
版权申诉
保障服务

基于Matlab的说话人识别的设计与开发.doc

1、本文档共37页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

重庆理工大学毕业论文基于Matlab的说话人识别目录 TOC \o 1-3 \h \u 18097 摘要 I 15468 Abstract II 25655 第一章引言 1 19538 1.1 研究背景及意义 1 17979 1.2 优势及应用前景 1 4034 1.3 国内外研究现状 1 25502 第二章说话人识别的基本原理 3 5159 2.1 说话人识别基本知识 3 1504 2.1.1 语音的发声机理 3 20389 2.1.2 清音和浊音 3 23224 2.1.3 语音信号模型 3 28873 2.1.4 语音识别基本过程 4 30563 2.2 预处理模块 4 32034 2.2.1 采样 4 883 2.2.2 量化 5 15685 2.2.3 预加重 5 12078 2.2.4 加窗 5 10822 2.3 特征提取模块 6 31158 2.3.1 短时平均能量分析 6 28593 2.3.2 短时平均幅度分析 7 11660 2.3.3 短时过零率分析 8 28291 2.3.4 短时自相关分析 8 28217 2.3.5 LPC倒谱系数（LPCC） 9 18456 2.3.6 Mel频率倒谱系数（MFCC） 9 31318 2.4 训练和识别模块 10 31641 2.4.1 矢量量化模型(VQ) 10 19531 2.4.2 隐马尔可夫模型（HMM） 11 18294 2.4.3 人工神经网络模型（ANN） 12 3623 2.4.4 HMM和ANN的混合模型 13 20908 第三章基于Matlab的说话人识别 14 16322 3.1 说话人识别系统平台介绍 14 3392 3.2 语音采集模板(Speech Recording Plane) 14 22641 3.3 预处理模板(Voice Preprocessing Plane) 15 11026 3.4 特征提取模板(Feature Extraction Plane) 17 26889 3.5 训练识别模板(Speech Recognition Plane) 18 22083 第四章总结与展望 25 32546 4.1 总结 25 16652 4.2 展望 25 23338 致谢 27 27884 参考文献 28 22597 附录 29 PAGE PAGE 4 摘要说话是人类相互沟通交流最方便、最快捷的一种方式，世界上每一个说话人都拥有自己特定的语音，正如每个人的指纹一样，都是绝无仅有的。说话人识别应用广泛，现已应用到通信、消费电子产品等各个领域。本文将把语音进行数字化传输、存储、然后进行识别等。说话人识别系统主要包括预处理、特征提取、训练和识别四个模块。其中预处理和特征提取尤为重要。有许多的预处理方法，对语音信号的采样和量化是第一，然后预加重和加窗。特征提取是指提取语音信号的重要特征的过程。信号的时域分析包括信号的短时平均能量和短时过零率等。频域分析可以采用LPC倒谱系数法和Mel倒谱系数法。为了训练得到模版语音信号，可以利用矢量量化（VQ）、隐马尔可夫模型（HMM）、BP神经网络（ANN）等对说话人的语音信号进行训练识别。说话人识别实现过程中的算法是多种多样的。本文将运用MATLAB仿真工具强大的编程、图形开发功能和数学计算能力。本文将把BP神经网络作为训练识别的方法，利用MFCC(MEL频率倒谱系数)产生的语音信号特征向量，最后运用十字交叉法，建立起一个说话人识别系统。结合MATLAB平台中的GUI设计预处理、特征提取、训练等几个模板，最后利用神经网络的模式识别，真正实现说话人的识别。关键词：语音识别 MATLAB 模式识别倒谱系数 Abstract Talking is a way of human communication, the most convenient and quick communication, each of the speakers all over the world have their own specific speech, as everyones fingerprints, are unique. Speaker recognition is widely used in various fields, have been applied t