- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2008年第3期 大 众 科 技 NO.3,2008
(总第1O3期) DAZHONG KE J (Cumulatively No.1 03)
基于VQ反模仿说话人识别再确认系统算法研究
周 鸣 ,景新幸
(1.桂林无线电一厂,广西 桂林 541004;2.桂林电子科技大学,广西 桂林 541004)
【摘 要】人的语音虽然具有独立性,但也是可以被模仿。语音模仿技术的出现就给当前的信息安全带来威胁,这就使得
有必要加强当前说话人识别系统的安全性,开展反模仿技术的研究。文章介绍了说话人识别方面的基本概念、原理以及当前的
研究现状,并介绍当前流行的说话人识别方法,并着重阐述基于动态阈值的说话人反模仿系统。
【关键词】矢量量化;语音模仿;反模仿;说话人识别;说话人确认
【中图分类号】TN912,34 【文献标识码】A 【文章编号】1008—1151(2008)03—0033-03
目前网络与信息系统的基础性、全局性作用日益增强, 1.矢量量化的基本原理
人们对信息安全的认识有了进一步的提高,这对信息安全保 VQ(Vector Quantization)即矢量量化。一组特征向量可
障工作提出迫切要求。语音模仿技术的出现给当前的信息安 以有效地代表说话人独特的声学特性,由于特征向量数目巨
全带来威胁,有必要 开展反模仿技术的研究,反模仿技术对 大,所需存储空间及计算量都非常大,因此可以使用矢量量
保障信息安全的作用是巨大的,它能更好的保障信息和命令 化技术来压缩说话人声学特性的模型。
的安全性。当前说话人辨认系统的性能已经非常好,而说话 矢量量化的基本原理是:将若干个标量数据组成一个矢
人确认系统的性能则相对较差。反模仿说话人再确认系统就 量 (或者是从一帧语音数据中提取的特征矢量)在多维空间
是利用说话人辨认系统的性能优于相应的说话人确认系统的 给予整体量化,从而可以在信息量损失较小的情况下压缩数
性能,我们就可以利用说话人辨认的识别方式来提高说话人 据量。矢量量化有效地应用了矢量中各元素之间的相关性,
确认系统的性能。随着信息技术的发展,社会管理日趋电子 因此可以比标量量化有更好的压缩效果。利用矢量量化技术
化、自动化,具有反模仿技术的说话人识别系统,必将得到 时,主要有两个问题要解决:
广泛的应用。 , (1)设计一个好的码本。为了建立一个好的码本要求建
(一)基于VQ的说话人识别理论及算法 立码本的训练数据不仅数据量要充分大,而且要有代表性;
说话人识别的基本原理是建立一个能够描述说话人语音 其次,要选择一个好的失真度准则以及码本优化方法。
特征的模型。在进行说话人辨认时,取与测试音匹配距离最 (2)未知矢量的量化。对未知模式矢量,按照选定的失
小的说话人模型所对应的说话人作为说话人辨认的结果;在 真测度准则,把未知矢量量化为失真测度最小的区域边界的
进行说话人确认时,用测试音的模型与所声称的说话人的模 中心矢量值 (码字矢量),并获得该码字的序列号 (码字在码
型进行比较,若匹配距离小于一个规定的阈值,则该说话人 本中的地址或标号)。
得到确认。由此可以看出,说话人辨认和说话人确认在本质 2.矢量量化器的码本设计及优化
上并没有什么差别。因此,若要实现说话人的识别,需解决 选择了合适的失真测度后,就可进行矢量量化器的最佳
以下几个基本问题: 设计。所谓最佳设计,就是从大量信号样本中训练出好的码
(1)对语音信号的预处理和特征提取; 本;
您可能关注的文档
- 基于CPLD和LCX016的通用投影仪的液晶驱动电路.pdf
- 基于CT切片的人脸三维重建.pdf
- 基于DEA的江西省农村扶贫监测评价.pdf
- 基于DNC的数字化设计与制造系统原理及应用.pdf
- 基于DSP技术的新型变频调速万能卧式铣床.pdf
- 基于EPA的一致性测试方法及硬件设计.pdf
- 基于ERP的中药制药企业信息化应用.pdf
- 基于FAHP的工程项目招标风险评价研究.pdf
- 基于F-B函数的牛顿法解一般约束优化规划问题.pdf
- 基于FEM-BEM的轿车车内低频噪声综合分析方法.pdf
- 医疗设备行业融资租赁模式创新:政策法规与市场发展趋势分析.docx
- 2025年基因编辑技术在眼科疾病治疗中的伦理审查机制.docx
- 新能源市场准入与监管政策2025创新模式与市场前景报告.docx
- 数字内容版权保护风险与监管政策研究报告.docx
- 新能源产业集群2025年技术创新与产业协同创新生态发展研究报告.docx
- 2025剧本杀IP化发展路径与产业生态构建研究.docx
- 2025年新能源汽车动力电池技术创新与成本控制分析报告.docx
- 2025年智慧养老社区适老化改造技术标准与社区养老资源整合报告.docx
- 农业科技创新对农村经济增长的贡献研究.docx
- 跨境电商零售进口监管体系优化与2025年行业发展趋势深度报告.docx
最近下载
- 2025年一级建造师执业资格考试《机电工程管理与实务》真题卷(附解析).docx VIP
- (新人教PEP版)英语六年级下册 Unit 4 大单元教学设计.docx
- 2025年秋季新教材部编版小学道德与法治二年级上册全册道法最新教案(教学设计).docx
- 2025年营养指导员考试真题库(含答案).pdf
- 八年级语文上册新教材解读课件(统编版2024).pptx
- 长征寻迹,爱心志愿——遵义五日红色旅游产品设计.pdf
- 野外数字路线地质调查野外数字填图教程.ppt VIP
- 中国在线供应链金融行业市场行情动态分析及发展前景趋势预测报告.docx
- c14测年和观音阁修建史的初步分析——c14测年在中国古代木结构建筑中的应用word格式论文.docx
- 场内35kV集电线路施工方案.doc VIP
文档评论(0)