基于ARM的说话人识别系统的研究与实现-电子与通信工程专业论文.docxVIP

下载本文档

0
0
约4.73万字
约 52页
2019-02-09 发布于上海
举报
版权申诉

基于ARM的说话人识别系统的研究与实现-电子与通信工程专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

万万方数据独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除了文中特别加以标注和致谢的地方外，论文中不包括其他人己经发表或撰写过的研究成果，也不包含为获得西北师范大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名: 12级日期: 2D!C o/.ù 1- 关于论文使用授权的说明本人完全了解西北师范大学有关保留、使用学位论文的规定，即:学校有权保留送交论文的复印件，允许论文被查阅和借阅;学校可以公布论文的全部或部分内容，可以采用影印、缩印或其他复制手段保存论文。 (保密的论文在解密后应遵守此规定) 签名: 如教导师签名: 甘J韭日期: JrJ? ，06.以西北西北师范大学硕士学位论文摘要近年来，随着智能设备发展的如火如荼，也带动了人机交互这一核心组成部分的进步。人机交互从之前的手势、手指操作也逐渐向语音这一人类最为自然、便捷、高效的交流方式上转变。语音作为人机交互的方式包括两方面内容，第一是让机器发出声音，这是语音合成的研究范畴，第二是让机器理解人说的话，这里面又包括能听懂人类发音的语义信息，称之为语音识别；或者能让机器辨别出是谁在说话，称为说话人识别，这也是本文的研究目标和重点之一。目前语音合成和语音识别已经较为普遍地应用到智能和其他一些设备上，但是能让机器区分出是谁在说话的说话人识别技术虽然在实验室条件下的研究较为成熟，但是其在日常应用中较少出现，不过其广阔的应用前景使嵌入式相关的说话人识别逐渐成为当下的研究热点。 ARM 作为目前最为常用的嵌入式处理器，具有低功耗、低成本、高性能的优点。并且其外设端口丰富，有利于开发多功能系统。本课题的主要任务是利用现有的资源，选择合适的说话人识别算法，最终实现具有较好实时性与准确性的说话人识别系统。本文提出了基于 ARM 的说话人识别系统的研究和设计，主要工作包括理论知识研究、确定系统方案、编写系统软件和整体设计实现四个部分。本文首先对相关数字信号处理方面的知识做了介绍，接着对准确率和实时性的问题进行了考量，在理论算法部分选择了 MFCC，GMM，UBM 等算法，最后通过 C++语言实现对说话识别处理中的预处理、Mel 频率倒谱系数特征提取、GMM 模型的训练以及对说话人辨认和确认的识别。本文硬件系统电路包括三星 S3C6410 处理器以及 FLASH 存储器、SDRAM、UDA1341TS 音频处理芯片、LED 显示等结构。在分析了 Linux 操作系统驱动程序的工作原理的基础上，研究了嵌入式 Linux 下驱动程序的开发过程，建立了交叉编译环境，完整的开发出 UDA1341TS 音频编解码芯片在本系统中的驱动程序，以及 GPIO 口的相关驱动，将说话人识别程序和驱动程序经过交叉编译产生的可执行程序下载到实验板上测试运行。经测试表明该系统能实时的采集语音信号，完成对说话人的判断，同时系统具有良好的准确度与实时性，且性能稳定，实现了系统小型化的整体设计方案，具有良好的发展空间。关键词：说话人识别；Mel 频率倒谱系数；高斯混合模型；ARM I 基于基于 ARM 的说话人识别系统的研究和实现 Abstract In recent years, with the development of smart devices in full swing, also led to advances in human-computer interaction of the core components. HCI from the previous gestures, finger operation has also been voice, the most natural, convenient and efficient way of human’s communicating. As human-computer interaction by voice includes two aspects, the first is to make the machine sound, this is the research areas of voice synthesis, and the second is to make machines understand what people say, there is also includes to understand semantic information, called the speech recognition; or let t