- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于倒谱加权的说话人识别技术.doc
基于倒谱加权的说话人识别技术
2006年5月
第儿卷第3期
西安邮电学院May.2006
JOURNALOFXIANUNIVERSITYOFPOSTANDTELECOMMUNICATIONSVo1.11No.3
基于倒谱加权的说话人识别技术
孙林慧,李平安
(南京邮电大学通信与信息工程学院,江苏南京210003)
摘要:提出一种通过加不同权值来考察语音各阶参数的抗噪性强弱的方法,采用此方法分析了对干净语音和加白
噪声语音的Mel倒谱各阶参数加不同权值后对识别系统性能的影响.得出结论:高阶Mel倒谱参数抗噪性较差而
低阶倒谱参数抗噪性较好.因此可以根据抗噪性的强弱对该倒谱各阶参数进行合理加权,以便突出抗噪性强的参
数对说话人识别系统的贡献.
关键词:权值;抗噪性;Mel倒谱;说话人识别
中图分类号:TN912.3文献标识码:A文章编号:1007—3264(2006)03—0009—04
引言
说话人识别在相当广泛的领域可发挥重要作
用…,如安全保卫领域,司法领域,军事领域,财经
领域,信息服务领域等等.正因为如此,说话人识别
越来越受到人们的重视.说话人识别系统根据应用
分为说话人辨认(SpeakerIdentification)和说话人证
实(SpeakerVerification)两种.说话人辨认是对给
定的声音,由系统来判断其属于已注册的一群人中
的某个特定人,说话人证实则是说话人先声明身份,
然后由系统判断目标声音是不是他所声称的人的.
根据待识别的文本又可以把说话人识别分为与文本
有关的说话人识别和与文本无关的说话人识别.前
者在训练和识别时采用相同内容的语句,后者在训
练和识别时采用不同内容的语句.本文采用文本无
关的说话人辨认系统.
一
般说话人识别系统包括训练和识别两个阶
段,系统的基本结构详见图l.提取语音特征参数
的目的在于保留反映说话人个性差异的特征,消除
其他冗余信息和无用信息.对说话人识别系统来
说,特征参数的提取与选择是一个重要环节.特征
参数的提取解决时域语音信号的数字表示问题,而
特征参数的选择则通过选取有效的特征为模式划分
部分提供数据.特征提取与选择的好坏直接影响到
识别器的性能.说话人识别一般都在噪声环境中进
行,如果我们可以预先知道各阶参数的抗噪性能,那
么就可以通过对它们进行合理的加权处理来有效的
选择特征参数,以便突出抗噪性强的参数对识别的
贡献.因此关键的问题是通过什么方法来考察各阶
参数抗噪性的强弱.本文提出一种通过加不同权值
来考察各阶参数的抗噪性强弱的方法.
图1说话人识别系统的基本结构
,l特征参数
l,1特征参数的鲁棒性
说话人识别是一种自动识别说话人身份的过
程.说话人识别和语音识别的区别在于,它不注重
收稿日期:2005—09—22
基金项目:江苏省高校青蓝工程计划项目(QIA)O3YZ)
作者简介:孙林慧(1979一),女,山西临汾人,南京邮电大学通信与信息工程学院助教.
李平安(1976一),男,山西运城人,南京邮电大学通信与信息工程学院硕士研究生
?
lO?西安邮电学院2006年5月
包含在语音信号中的文字符号以及语义内容信息,
而是着眼于包含在语音信号中的个体特征,提取说
话人的这些个体信息特征,以达到识别说话人的目
的.因此,说话人识别提取的特征参数要能很好的
表征说话人个体信息特征.一般情况,说话人识别
系统在实验室环境下有很好的识别效果,但在实际
的环境下性能下降很多,造成此现象的主要原因是
识别与训练条件的误匹配.说话人识别系统中可能
引入干扰的因素有:说话人说话方式的变化(如说话
人说话速度,音量的变化以及由疾病,情绪引起的变
化等),录音环境(如麦克风的变化,背景噪声的干
扰)以及传输影响(如传输信道畸变和线路噪声干扰
导致误码,传输过程中数据分组丢失)等等.提取鲁
棒性的特征参数是目前说话人识别技术的一个热点
和难点.寻找具有鲁棒性的参数,要求其满足下述
条件:
(1)能有效的区分不同的说话人,含有说话人的
个性特征;
(2)对同一说话人,当说话人说话方式改变时特
征参数变化小;
(3)抗噪声和信道干扰能力强.
多年来,各国研究者对各种特征参数在说话人
识别中的有效性进行了大量的研究,并且得到了许
多重要的结论.说话人识别系统中常用的特征可划
分为如下几类:
(1)线性预测参数及其派生参数:如线性预测参
数(LPC:LinerPredictionCoefficient)及LPC倒谱
参数(LPCC:LinerPredictionCepstralCoefficient),
声道面积比函数,线谱对参数和部分相关参数等;
(2)语音频谱导出的参数:如基音轮廓,功率谱,
共振峰带宽及其轨迹和MEL倒谱参数(MFCC,Mel
—
FrequencyCepst
您可能关注的文档
最近下载
- 2025年陕西高中学业水平考试信息技术试卷真题(含答案详解).pdf VIP
- 2024年锅炉操作工(初级)专业技能考试题库附答案(真题版) .pdf VIP
- 英语课程标准研究与教材分析(第2版)课件全套 第1--9章 英语课程标准和英语课程的基本概念 ---英语教材难度分析.pptx
- 《移动通信技术》课件——1主题一 发展历程-----移动通信的前世今生.pptx VIP
- 1000亩四季采摘水果园建设可行性研究报告.pdf VIP
- 河北省工伤职工停工留薪期分类目录.xls VIP
- 做外贸必读:外老们都是如何采购的——厦门区域兰彦晖分享.doc VIP
- (2020版新教材)闽教版五年级上册信息技术全册课件.pptx VIP
- (2025年)科创板试题及答案.docx VIP
- 第113届广交会跨国采购清单概览.pdf VIP
文档评论(0)