文本相关说话人识别嵌入式系统及其关键技术分析-embedded system for text-related speaker recognition and analysis of its key technologies.docxVIP

文本相关说话人识别嵌入式系统及其关键技术分析-embedded system for text-related speaker recognition and analysis of its key technologies.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文本相关说话人识别嵌入式系统及其关键技术分析-embedded system for text-related speaker recognition and analysis of its key technologies

河北工业大学硕士学位论文 河北工业大学硕士学位论文 文本相关说话人识别嵌入式系统及其相关技术研究 文本相关说话人识别嵌入式系统及其相关技术研究 PAGE PAGE 11 PAGE PAGE 10 第一章 绪论 §1-1 说话人识别发展和现状 说话人识别是生物特征识别的一种,同人脸识别,指纹识别,虹膜识别,DNA 等一样属于一种提 取人的生理或行为特征作为身份标识的鉴别技术。随着信息技术的发展,生物特征识别技术在身份认 证,银行,安全等领域比以传统密码为基础的身份识别表现出来越来越大的优势。语音信号是一个复 杂的时变信号,它包含了大量复杂的信息,除了说话人想要表达的语义信息,还包含着大量与说话人 的发声器官相关的生理特性和长时间后天养成的发声行为特性信息。因此,从中提取说话人相关的个 性信息从而进行身份的识别和验证也是生物特征识别当中一个重要的组成部分。 使用计算机进行说话人识别始于 20 世纪 60 年代,Bell实验室的LAWRENCE KERSTA采用计算机生成 语音信号的图谱,然后用概率统计方差的方法分析声纹推动了说话人识别的研究发展。随后的几十年 里,研究人员对说话人识别技术进行了大量研究,采用模板匹配,动态时间规整[1,2,3],神经网络[4,5], 隐马尔可夫模型等各种算法实现了说话人识别。在 80 年代,美国NIST(National Institute of Standard and Technology)成立了一个语音小组,来促进语音信号处理的研究。自 1996 年以来,在NIST的资助 下,语音小组每年进行一次说话人识别技术发展的评估和测试[6],以此来促进说话人识别的不断发展。 在国内,近几年来众多科研机构及公司也投入了很大的力量对汉语说话人识别进行研究。例如: 微软亚洲中国研究院在进行自然语音输入接口研究的同时,说话人识别技术是该研究院语音组的重要 研究方向之一;北京大学视觉与听觉信息处理国家重点实验室,在国家自然科学基金,及“863”计划 的支持下,其说话人识别技术的研究代表着国内的先进水平;中国科学院自动化研究所模式识别国家 重点实验室首批筛选推出的科研项目就有说话人识别技术;清华大学、中科院声学所、上海交通大学、 西安电子科技大学等国家重点院校,对说话人识别技术的研究都做出了许多贡献。 说话人识别从理论走向应用的关键步骤是其嵌入式实现,随着国内众多厂商在语音方面的积累的 成熟,源自清华大学智能技术与系统国家重点实验室的北京得意音通技术有限责任公司于 2002 年 11 月 1 日为完成了“声纹USB随身锁”产品的开发。近来有大量文献研究了说话人识别系统在嵌入式实时 平台上的实现[7,8,9]。随着DSP技术的发展,先后有大量的研究人员在DSP平台上实现初步的说话人识别 [10,11,12],其中有DSP声纹汽车锁[13]和楼宇语音单元门声锁[14],DSP门禁系统等,实现了说话人识别的应 用,为说话人识别从理论走向实际应用打下了坚实的基础。 说话人识别经过近 60 年的研究,逐步从理论走向实际,已经取得了很大的成绩,但是还存在着许 多问题。理论方面:什么是说话人个性特征目前还没有理论的依据,说话人识别采用的特征沿用了语 音识别的特征,考虑到说话人识别与语音识别的对立性,采用相同的特征参数必定不利于后期的建模 和分类,识别效果也会受到影响,如何从语音中分离说话人个性特征是目前一个研究的难点。应用方 面:小型化和嵌入式系统是语音识别应用的重要方面,在嵌入式系统应用中,由于硬件资源的限制以 及实时性的要求,算法的准确性和复杂度的平衡是研究的重点,采用什么样的算法往往需要根据实际 应用经过实验来确定,因此需要根据实际应用的问题进行大量的实验,以取得合适的算法和参数。 §1-2 说话人识别分类 说话人识别的分类方式有很多中种,按照最终完成的任务,说话人识别可以分为:说话人辨认 (Speaker Identification)和说话人确认(Speaker Verification)。说话人辨认是指说话人事先不 声明身份,辨认出待识别说话人的语音到底属于 N 个参考说话人之中的哪一个,有时还要对这 N 个说 话人以外的语音做出拒绝的判决。说话人辨识是一个多元判决的问题。 说话人确认是指说话人事先声明身份,然后由系统根据说话人的声明判断该说话人是否是其所声 称的说话人。这个过程只涉及的是一个特定的参考模型与待识别语音之间的比较,最后由系统给出做 出“是”或“不是”的二元判决。 本质上,说话人辨认和说话人确认都是根据说话人所说的测试语句或关键词,提取出说话人的个 性特征,然后将其个性特征向量与存储的参考模型进行比较,从而得到识别结果。由于在说话人辨认 中要进行多次的比较和判决,所以说话人辨认的误识率要大

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档