- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于i―vector声纹识别上课点名系统的设计与实现[Word文档].doc
基于i―vector声纹识别上课点名系统的设计与实现
关键字:基于,vector,声纹识别,上课,点名,系统,设计,实现 基于i―vector声纹识别上课点名系统的设计与实现
本文为Word文档,感谢你的关注!
摘要: 当今课堂教学过程中存在着学生旷课、老师需要经常检查课堂出勤情况等问题。本系统着眼于课堂教学的实际需要,旨在方便任课老师了解学生上课出席情况,以及防止冒名顶替等不公正现象的发生,开发了基于i-vector?纹识别技术的上课点名系统,不仅在说话人识别的研究领域有探索意义,而且在方便老师课堂管理方面有着重要的实践意义。
关键词:上课点名系统; 声纹识别; 跨平台交互
TP391
文献标志码: A
2095-2163(2016)06-0108-03
0引言
声纹识别(voice print recognition)也称为说话人识别[1](speaker recognition),是通过对说话人语音信号特征的分析处理,识别说话人身份的过程。与语音识别不同,说话人识别侧重于说话人的身份而非说话的内容。按照说话内容的类型,可分为文本有关和文本无关。前者要求说话人在训练与识别阶段说相同的内容,而后者无此要求。所以,文本无关说话人识别应用将更为广泛,但识别难度也必然更大。
对说话人识别的研究始于 20 世纪 30 年代,早期主要进行有关人耳听辨方面的研究。而对说话人自动识别的研究则需上溯自60年代。在语音特征提取方面,1962 年Kesta提出使用语谱图进行说话人识别的方法[2],1969年Luck等人将倒谱技术首度应用于说话人识别[3],1976 年 Atal等人进一步提出线性预测倒谱系数 [4]。而在说话人识别模型方面,60及70年代初期,主要采用的是模板匹配方法。70 年代后期,动态时间规整和矢量量化技术相应地已然成为研究和发展重点[5-7]。
80 年代后,Davis 等人提出了 Mel 频率倒谱系数(Mel Frequency Cepstrum Coefficient,简称MFCC)[8]。由于MFCC考虑了人耳的听觉感知机理,表现出良好的识别效果和噪声鲁棒性,从而成为说话人识别中使用的基础评判参数。与此同时,人工神经网络和隐马尔可夫模型[9]也在语音识别领域获得了成功与广泛的应用,由此晋升为说话人识别中的核心技术。90年代后,高斯混合模型凭借其简单、灵活、有效以及出众的鲁棒性,迅速演进成为目前与文本无关的说话人识别中的主流技术[10]。进入21世纪以后,Reynolds等人提出 GMM-UBM(Gaussian Mixture Model with Universal Background Model) 模型用于文本无关说话人识别,使得训练GMM的样本数量要求减少,文本无关的说话人识别开始从实验室走向了广阔现实应用[11]。
2006 年,Campbell等人在GMM-UBM基础上提出高斯超向量概念,并与支持向量机融合为高斯混合超向量-支持向量机模型用于文本无关说话人识别,由此突破性地发展成为目前国内外文本无关说话人识别的热点关键实用技术[12]。近年来,学者们又在高斯超向量基础上,提出了联合因子分析 [13]、鉴别性向量(i-vector)[14]等模型,使得文本无关说话人识别系统的性能取得了显著的改进与提升。本系统是基于i-vector构建的声纹识别系统。i-vector说话人建模技术[15]的基本思想可大致描述为:信道和会话的影响均包含在总体变化子空间中,通过对包含说话人信息和信道信息的GMM均值超矢量在低秩的总体变化子空间上进行投影,得到只包含说话人信息的低维矢量。基于声纹识别的上课点名系统为教师课堂出勤管理提供了一整套行之有效的解决方案,从而大大提高了上课点名系统的性能。
[BT4]1系统的整体架构
上课点名系统总体架构分为PC端和移动端,两者通过无线网络相连。系统呈现C/S结构,在整体架构上可分为4层:最底层由无线网络、PC和手机来提供支撑;第二层包含网络TCP/IP协议和Socket;第三层由声纹识别算法、数据库和Android系统的API构成;最顶层即由系统各功能模块组成。综上可知,以上4层构成了完整的上课点名系统。
上课点名系统分为5大模块,具体可表述为:PC端的训练模块、点名模块、统计模块、移动端的点名模块和本地录音模块。PC端承载了大运算量的识别任务,而移动端只负责语声的录音、简单转换和发送工作。PC端点名模块设计为主控整体的点名过程,移动端的点名模块则实施完成每个学生的点名工作。
[BT5]1.1训练模块
训练模块是上课
您可能关注的文档
最近下载
- 某实验室装修工程投标文件—技术标.docx VIP
- Unit 6 A Day in the Life 单元检测(含答案) 人教版(2024)英语七年级上册.docx VIP
- B级法兰锻制-作业指导书生产用设备操作与维护规程汇编.doc VIP
- T_ZJAF 13.1-2023 公共视频资源 第1部分:总则.docx VIP
- 第四课 用联系的观点看问题(精品课件)-【中职专用】高二思想政治《哲学与人生》同步精品课堂(高教版2023·基础模块).pptx VIP
- 2025年高考政治真题试卷(新课标卷)+解析及答案001.docx VIP
- 2022年职业教育国家级教学成果奖申报书.pdf VIP
- 《吸入装置使用》课件.pptx VIP
- 患者隐私保护与信息安全培训.pptx VIP
- IT运维管理制度流程图.pdf VIP
文档评论(0)