最新语音声纹识别技术和应用.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
典型应用— 基于声纹识别技术的电话语音远程考勤系统 电话通信中,通过识别来电号码(必须是固定电话)和来电者说话声音的个人特征,我们的系统就可以快速的自动判断被监控人是否在规定的时间出现在规定的场所执行任务,以及记录在该场所停留的时间长度。 这个技术方案主要应用在电话远程考勤、移动办公、医疗服务监控、监狱管理、劳改犯人的狱外服刑以及对假释犯罪嫌疑人的自动监控等方面。 参考资料 X.D. Huang, A. Acero, and H.-W. Hon, Spoken Language Processing: a Guide to Theory, Algorithm, and System Development, Upper Saddle River, New Jersey: Prentice Hall, 2001. L.R. Rabiner and B.-H. Juang, Fundamentals of Speech Recognition, Prentice-Hall, Englewood Cliffs, 1993. T. Kinnunen, H.Z. Li, An overview of text-independent speaker recognition: From features to supervectors, Speech Communication, Volume 52, Issue 1, January 2010, Pages 12-40. HTK: http://htk.eng.cam.ac.uk/ Sensory: TalentedSoft: CTI论坛: / 谢 谢! 放映结束 感谢各位的批评指导! 让我们共同进步 * * * * Content Layouts 通过和数据库中已经注册的所有人做对比,挑选出最有可能的说话人列表 特征比对 声纹鉴别 提取 声纹特征 ID 得分 99 65 60 60 声纹识别两个方向 文本无关声纹识别 文本相关声纹识别 注册与测试可采用任意不同文本 注册与测试必须采用相同的文本 注册与测试录音要求较长 (注册20s,测试8s) 注册与测试录音要求较短 (注册、测试均只需1~3s) 注册与测试语音不必强求一致 注册与测试录音尽量要求相似 适合后台监控,海量数据检索 可以作为声纹密码,一对一服务 虚警相对较高 准确度很高 声纹系统的优点 与其他生物识别技术(如脸型、掌形、虹膜识别等)相比较: 1 2 3 衡量声纹系统效果指标 Imposter False Accept Rate (FAR) User False Reject Rate (FRR) 安全性高 Balance 易用性强 EER: FR=FA X 阈值= 4 X 阈值= 2 错误接受率(False Accept Rate) 指非本人被错误的认为是本人的次数占总共测试次数的比值 错误拒绝率(False Reject Rate) 指本人被错误的认为是非本人的次数占总共测试次数的比值 相等错误率(Equal Error Rate) 指FA等于FR时的百分比。是衡量声纹验证效果的重要依据 声纹系统准确率 系统 EER 时长标准 InterVeri(非声纹密码系统) 综合7% 注册语音:20秒 测试语音:10秒 声纹密码系统 0.5% (冒认者不知道密码) 2.5% (冒认者知道密码) 注册和测试:2秒左右 基于科大讯飞深厚的研究积累,整合国际说话人识别大赛第一名的领先技术,提供业界领先的高准确率,帮助语音应用获得最佳安全性。 第三方评测 代号 代表机构 三大核心测试指标 在44个系统中排名 MinDCF EER DCF MinDCF EER DCF ifly 科大讯飞 0.107 2.625 0.187 1 1 3 i4u CMU、新加坡IIR与科大讯飞、澳大利亚新南威尔士、南洋理工合作提交的系统 0.123 3.225 0.178 2 2 1 lpt 意大利Loquendo公司 0.145 3.188 0.188 3 4 4 * * 参赛单位有:CMU、MIT、Stanford、清华大学、中科院自动化所、中科院声学所、Motorola研究中心、IBM 研究院等国内外43家著名语音研究机构 由NIST(美国国家标准技术研究院)举办,是国际上规模与影响力最大的说话人识别评测 1996年第一次评测,之后每两年评测一次,2008年说话人识别任务难度接近大规模实际应用环境(不同信道、不同环境干扰) 科大讯飞首次参赛就获得综合指标第一名的好成绩 声纹产品系统结构 ISV2.1 (Verification) 根据系统提示自动完成身份确认

文档评论(0)

文档分享 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档