- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数字信号处理课程设计..doc
数 字 信 号 处 理
课程设计报告
题目: 基于声音的说话人身份识别技术研究
学院: 信 息 工 程 学 院
专业: 通 信 工 程
指导教师: 符 茂 胜
指导时间: 2014.12
姓 名
(学号) 承 担 任 务 李治龙(2012013919) GUI界面制作 夏梁站(2012013936) 程序测试与修改 雷超群(2012013918) 实验报告编写 刘怡(2012013923) PPT制作 陆瑶(2012013924) 语音库采集、构建 张帝(2012013943) 实验程序编写
指
导
教
师
评
价
意
见
成
绩
目录
1、背景 - 4 -
2、设计目的 - 4 -
3、设计原理 - 5 -
3.1 语音识别技术的分类 - 5 -
3.2 Mel频率倒谱系数 - 6 -
3.2.1 Mel频率倒谱系数基本原理 - 6 -
3.2.2 MFCC的提取流程 - 7 -
3.3 矢量量化 - 9 -
3.3.1 矢量量化的简单介绍 - 9 -
3.3.2 矢量量化的定义 - 9 -
3.3.3 矢量量化的基本原理 - 10 -
3.4 矢量量化的失真测度 - 11 -
3.4.1 欧氏距离--均方误差 - 11 -
3.5 识别失真度 - 12 -
4、设计过程 - 13 -
4.1、实验技术路线图 - 13 -
4.2、实验结果测试图 - 14 -
5、实验代码与结果分析 - 15 -
5.1、MATLAB源程序 - 15 -
GUI界面: - 15 -
测试程序 - 17 -
Mel倒频谱系数函数 - 18 -
库函数 - 19 -
滤波程序 - 20 -
录音程序 - 20 -
5.2、实验结果分析 - 21 -
6、实验体会和总结 - 22 -
7、文献 - 23 -
1、背景
随着信息化的迅速发展,人们对身份识别技术的需求越来越多,并对其安全性和可靠性的要求也越来越高。基于传统密码认证的身份识别技术在实际信息网络应用中已经暴露出许多不足之处,而基于生物特征辨别的身份识别技术近年来也日益成熟并在实际应用中展现出极大的优越性。作为生物特征认证的一个重要分支,语音识别同指纹识别、人脸识别、虹膜识别一样,一直以来都是研究者们关注和探索的热点之一。
语音识别技术也成为了近年的研究热点,有不少实用化的技术成果被商家成功推向了市场,让人们看到了它在PDA、智能家电、工业控制等领域的广阔发展前景。例如现在国内在语音方面做的最好的就是科大讯飞股份有限公司,?科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。语音识别技术有很大可能产生新的服务,给人们的工作和生活带来非常可观的方便。
我国语音识别研究工作起步于五十年代。近年来国内研究水平也从实验室逐步走向实用。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。
2、设计目的
每个人都有自己特有的发音器官和特有的说话习惯,这些差异都式反映在说话人语音信号的波形中,且比较复杂,使得每个人的发音都伴有浓重的个人色彩,这是说话人识别得以实现的客观保证。说话入识别涉及到人的发音器官、说话习惯、语言构造和发声原理等多方面的内容,它综合了生理学、语音学、数字信号处理、模式识别、人工智能等学科知识,有着广阔的市场应用前景。通过说话人识别技术,可以实现用语音信息进行说话人的身份鉴别。利用说话人识别技术还可以通过语音实现对一些服务的控制,例如语音拨号、电话银行、数据库访问服务、信息服务和计算机的远程访问等等。而且,说话人识别技术有很大可能产生新的服务,给人们的工作和生活带来非常可观的方便,本次试验主要目的为提出和设计开发能够快速准确识别不同个体的可行方案。
3、设计原理
3.1 语音识别技术的分类
语音识别系统可以根据对输入语音的限制加以分类。
从说话者与识别系统的相关性考虑
可以将识别系统分为3类:
特定人语音识别系统:仅考虑对于的音进行识别;
非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习;
多人的识别系统:通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对识别的那组人的语音进行训练。
从说话的方式考虑
也可以将识别系
文档评论(0)