基于说话人声音识别的技术研究.doc

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数 字 信 号 处 理 课程设计报告 题目: 基于声音的说话人身份识别技术研究 学院: 信息工程学院 专业: 通信工程 指导教师: 符茂胜 指导时间: 2014.12.22-2014.12.28 姓 名(学号) 承 担 任 务 艾 洲(2012014001) MATLAB程序编写与调试、文档编写、资料搜集 王玉贵(2012014035) PPT制作、文档编写、资料搜集 余文正(2012014040 PPT制作、文档编写、资料搜集 宁文静(2012014025) 文档编写、资料搜集 刘安邦(2012014020) 文档编写、资料搜集 汪中日(2012014031) 文档编写、资料搜集 指 导 教 师 评 价 意 见 成 绩 目录 TOC \o 1-3 \h \z \u 一、背景 1 二、设计目的 1 三、设计基本原理 2 1.说话人识别的分类 2 2.说话人识别的基本原理和系统结构 3 四、模式匹配与特征提取 4 1.模式匹配使用方法: 4 2.特征提取 5 2.1 常用的特征参数 5 2.2语音的倒谱分析(MFCC)简介 5 2.3 MFCC倒谱系数及其提取算法 6 2.4 求取MFCC系数的具体算法和步骤 8 五、模式识别及算法优化 11 1. GMM模型的基本概念 11 2. GMM模型的参数估计 12 2.1 EM算法的计算 13 3. 算法优化(MFCC中加入能量信息) 15 六、实验代码及设计分析 16 1.实验代码 16 2.设计分析 16 2.1 问题的分析 17 七、 实验体会及总结 17 八、参考文献 18 皖西学院2012届信息工程学院课程设计 PAGE17 / 18 基于声音的说话人身份识别技术研究 一、背景 伴随着全球化、网络化、信息化、数字化时代的到来,我们对高可靠性的身份验证技术与身份识别技术的需求也日益增长。传统的以密码为特征的身份认证技术暴露出巨大的弊端,很难满足高安全性和长效安全性的要求,而在生物学和信息科学高度发展的今天,生物认证技术作为一种便捷、先进的信息安全技术已经在现实生活中得到广泛的应用。这是根据人体自身的生理特征(指纹、手形、脸部、虹膜)和行为特征(声音、签名)来识别身份的技术,它是集光学、传感技术、红外扫描和计算机技术于一身的第三代身份验证技术,能满足现代社会对于身份鉴别的准确性、安全性与实用性的更高要求。在信号检测与处理、模式识别、人工智能、机器学习等理论与技术迅速发展的推动下,不久的将来,生物认证技术必将进入一个光辉的时代。比尔盖茨曾经预言“以人类生物特征进行身份验证的生物识别技术,在今后数年内将成为IT产业最为重要的技术革命。” 语音是人的自然属性之一,由于说话人发声器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这使得通过分析语音信号来识别说话人成为可能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有特征,不会丢失或遗忘;语音信号的采集方便,系统设备的成本低;另外利用电话网还可以实现远程客户服务等等。近年来,利用语音特征进行身份鉴别的说话人识别(也叫说话人识别)在生物认证技术领域中越来越受到研究者的关注。 二、设计目的 说话人识别(Speaker Recognition),是近年来兴起的一种生物识别技术,说话人识别以其独特的方便性、经济性和准确性等优势受到世人瞩目。近年来,随着科学技术的发展,说话人识别技术已经得到了极大的发展,它在公安侦察、声控系统、医疗诊断、电子金融等行业和领域有着极其广阔的市场应用前景。说话人识别根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份。与语音识别不同,说话人识别技术并不注意语音信号中的语义内容,而是希望从语音信号中提取出个人的信息特征。 说话人识别有几个关键技术:首先是特征选取的问题,从声学或者统计学的角度从声音信号中提取某些特征参数,用这些特征参数来描述说话人的声音特征。其次是识别模型,用机器学习模型去学习、记忆说话人特征,从而达到识别的目的。基于基本说话人识别理论和技术的研究,本文基于Mel倒谱系数(MFCC)语音特征参数,采用人工神经网络作为识别模型,研究设计了一个说话人识别的原型系统。MFCC是目前使用最广泛的语音特征之一,具有计算简单、区分能力好等突出的优点. 三、设计基本原理 1.说话人识别的分类 说话人识别

文档评论(0)

guocuilv2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档