- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
说话人识别中特征参数的提取及优化研究(硕士学位论文)
分类号 TN912 密级
UDC
硕 士 学 位 论 文
A Dissertation Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Science in Engineering
Study of extraction and optimization characteristic parameters in speaker recognition
内 容 摘 要
说话人识别技术是语音信号处理一个研究热点。特征提取和模式匹配是说话人识别技术的关键,特征选取与优化处理能够提高识别率,本文所做的主要工作如下:
一、在语音信号前端处理时,为了提高在强噪声环境下语音端点检测的准确度,提出基于子带二次谱熵的端点检测算法。该算法把子带二次谱熵作为端点检测新的特征参数,将有限状态机判别方法与子带二次谱熵相结合,有效地解决单门限法易出现的两类误判。与传统的短时能量与过零率结合法、谱熵法两种方法相比,基于子带二次谱熵的端点检测算法具有准确性高,抗噪性强等优点。
二、提取基音轮廓特征时,分析了现有功率谱二次处理基音检测方法的不足:对于过渡语音,易产生半频或倍频误判;噪声干扰下,检测结果易失真;清、浊音的判断方法复杂。针对不足,提出一系列改进方法:时域非线性处理,频域加窗滤波,简化清、浊音判断。仿真实验结果表明,无论是高信噪比还是低信噪比语音,改进的二次谱法较传统的平均幅度差函数(AMDF)法和二次谱法更能清晰、准确地检测出基音轨迹。
三、提出了新的特征组合参数:基于人的听觉特性的Mel频率倒谱系数(MFCC)参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率作为说话人识别系统的特征参数,实验结果表明,使用该参数较单独使用MFCC参数的说话人识别系统识别率提高了2%-3%。
四、为了提高MFCC作为说话人识别特征参数的识别率,提出了基于Fisher比及相关距离的MFCC提取方法,并根据Fisher比及相关距离的值,采用两种方法对MFCC参数分析:降维、窗函数倒谱提升。仿真实验表明:降维方法能使识别率提高10%-15%;新的特征加权的识别率较传统的raised-sine和half raised-sine窗提高了10%-20%。
本文主要对说话人识别的特征提取与优化处理进行研究。在识别的前端,使用了较准确的端点处理方法;选取了基音轮廓、MFCC组合特征,并给出了MFCC优化方法。本文的研究工作有助于说话人识别率的提高,有助于特征提取与优化方法的进一步发展。
关键词:说话人识别 端点检测 基音检测 组合特征 Fisher比-相关距离准则
Abstract
Speaker recognition has become a hot research topic in the field of speech signal processing. The key points of a speaker recognition system are feature and recognition algorithm. In this paper, attention is paid on the former, i.e., feature extraction and optimization. The mainly contributions are as follows:
a. Voice activity detection (VAD) in strong noise environments is improved by an algorithm based on subband reprocessed spectrum entropy (BRSE). A new voice/noise discrimination algorithm is proposed by combining the finite state machine (FSM) with BRSE. The misdetections caused by using single-threshold are reduced greatly. Experimental results show that the proposed algorithm has higher accuracy and stronger
您可能关注的文档
- 茂名7号机可研报告(出版稿)_北京节能培训.doc
- 茅台酒厂十二五扩建技改工程抗滑桩爆破施工方案.doc
- 茌平XX生态餐饮等园林开发项目规划书(可行性研究).doc
- 茶叶良种繁育场建设项目可行性研究报告(可行性研究暨初步设计报告).doc
- 茶业有限公司新建年产100吨名优绿茶清洁化加工技术改造项目可行性研究报告.doc
- 茶滘城中村改造项目(自编4号地块)工程消防系统施工方案.doc
- 苹果精深加工项目可研报告(资金申请报告).doc
- 荣昌县农副产品综合批发交易市场两防整治监理细则.doc
- 药品销售系统数据库课程设计毕业设计(论文).doc
- 药业有限公司维生素C(又称抗坏血酸、VC、维生素丙)初步设计工艺专篇说明书.doc
- 电工(高级)资格证考试考试黑钻押题附参考答案详解(轻巧夺冠).docx
- 电工(高级)资格证考试考试黑钻押题附完整答案详解【各地真题】.docx
- 电工(高级)资格证考试考试黑钻押题附参考答案详解(突破训练).docx
- 电工(高级)资格证考试考试黑钻押题附参考答案详解(研优卷).docx
- 电工(高级)资格证考试考试黑钻押题附参考答案详解(综合卷).docx
- 电工(高级)资格证考试考试黑钻押题附完整答案详解【历年真题】.docx
- 电工(高级)资格证考试考试黑钻押题附完整答案详解【必刷】.docx
- 电工(高级)资格证考试考试黑钻押题附参考答案详解(满分必刷).docx
- 电工(高级)资格证考试考试黑钻押题附完整答案详解【易错题】.docx
- 电工(高级)资格证考试考试黑钻押题附参考答案详解(模拟题).docx
最近下载
- 光电探测器仿真:多物理场耦合仿真_(10).多物理场仿真软件介绍.docx VIP
- 河北大学2021-2022学年第1学期《高等数学(上)》期末考试试卷(B卷)及标准答案.pdf
- 阿特拉斯•科普柯 冷冻式干燥机.pdf VIP
- 污染物处理及排放与国家和地方环境保护标准的符合性.docx VIP
- RCEP背景下山东省农产品对日本出口竞争力研究.docx VIP
- 下咽恶性肿瘤的护理.ppt
- 中国医药生物工程新建项目大全.doc VIP
- 公司员工离职报告(15篇).docx VIP
- 呼和浩特教师招聘(D 类)试题 策略选择专项练习题参考答案及解析 .pdf VIP
- 呼和浩特教师招聘(D 类)试题之 教育常识与策略选择(含有答案与解析).pdf VIP
原创力文档


文档评论(0)