基于说话人声音识别的技术研究.doc

下载文档 降价啦

5
0
约1.18万字
约 21页
2019-07-17 发布于江西
举报
版权申诉
保障服务

基于说话人声音识别的技术研究.doc

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

数字信号处理课程设计报告题目：基于声音的说话人身份识别技术研究学院：信息工程学院专业：通信工程指导教师：符茂胜指导时间: 2014.12.22-2014.12.28 姓名（学号）承担任务艾洲（2012014001） MATLAB程序编写与调试、文档编写、资料搜集王玉贵（2012014035） PPT制作、文档编写、资料搜集余文正（2012014040 PPT制作、文档编写、资料搜集宁文静（2012014025）文档编写、资料搜集刘安邦（2012014020）文档编写、资料搜集汪中日（2012014031）文档编写、资料搜集指导教师评价意见成绩目录 TOC \o 1-3 \h \z \u 一、背景 1 二、设计目的 1 三、设计基本原理 2 1.说话人识别的分类 2 2.说话人识别的基本原理和系统结构 3 四、模式匹配与特征提取 4 1.模式匹配使用方法: 4 2.特征提取 5 2.1 常用的特征参数 5 2.2语音的倒谱分析（MFCC）简介 5 2.3 MFCC倒谱系数及其提取算法 6 2.4 求取MFCC系数的具体算法和步骤 8 五、模式识别及算法优化 11 1. GMM模型的基本概念 11 2. GMM模型的参数估计 12 2.1 EM算法的计算 13 3. 算法优化（MFCC中加入能量信息） 15 六、实验代码及设计分析 16 1.实验代码 16 2.设计分析 16 2.1 问题的分析 17 七、实验体会及总结 17 八、参考文献 18 皖西学院2012届信息工程学院课程设计 PAGE17 / 18 基于声音的说话人身份识别技术研究一、背景伴随着全球化、网络化、信息化、数字化时代的到来，我们对高可靠性的身份验证技术与身份识别技术的需求也日益增长。传统的以密码为特征的身份认证技术暴露出巨大的弊端，很难满足高安全性和长效安全性的要求，而在生物学和信息科学高度发展的今天，生物认证技术作为一种便捷、先进的信息安全技术已经在现实生活中得到广泛的应用。这是根据人体自身的生理特征(指纹、手形、脸部、虹膜)和行为特征(声音、签名)来识别身份的技术，它是集光学、传感技术、红外扫描和计算机技术于一身的第三代身份验证技术，能满足现代社会对于身份鉴别的准确性、安全性与实用性的更高要求。在信号检测与处理、模式识别、人工智能、机器学习等理论与技术迅速发展的推动下，不久的将来，生物认证技术必将进入一个光辉的时代。比尔盖茨曾经预言“以人类生物特征进行身份验证的生物识别技术，在今后数年内将成为IT产业最为重要的技术革命。” 语音是人的自然属性之一，由于说话人发声器官的生理差异以及后天形成的行为差异，每个人的语音都带有强烈的个人色彩，这使得通过分析语音信号来识别说话人成为可能。用语音来鉴别说话人的身份有着许多独特的优点，如语音是人的固有特征，不会丢失或遗忘;语音信号的采集方便，系统设备的成本低;另外利用电话网还可以实现远程客户服务等等。近年来，利用语音特征进行身份鉴别的说话人识别(也叫说话人识别)在生物认证技术领域中越来越受到研究者的关注。二、设计目的说话人识别(Speaker Recognition),是近年来兴起的一种生物识别技术,说话人识别以其独特的方便性、经济性和准确性等优势受到世人瞩目。近年来,随着科学技术的发展,说话人识别技术已经得到了极大的发展,它在公安侦察、声控系统、医疗诊断、电子金融等行业和领域有着极其广阔的市场应用前景。说话人识别根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份。与语音识别不同,说话人识别技术并不注意语音信号中的语义内容,而是希望从语音信号中提取出个人的信息特征。说话人识别有几个关键技术:首先是特征选取的问题,从声学或者统计学的角度从声音信号中提取某些特征参数,用这些特征参数来描述说话人的声音特征。其次是识别模型,用机器学习模型去学习、记忆说话人特征,从而达到识别的目的。基于基本说话人识别理论和技术的研究,本文基于Mel倒谱系数(MFCC)语音特征参数,采用人工神经网络作为识别模型,研究设计了一个说话人识别的原型系统。MFCC是目前使用最广泛的语音特征之一,具有计算简单、区分能力好等突出的优点. 三、设计基本原理 1.说话人识别的分类说话人识别