- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万
万方数据
独创性声明
本人声明所呈交的论文是我个人在导师指导下进行的研究工作及 取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包括其他人己经发表或撰写过的研究成果,也不包含为获得西 北师范大学或其他教育机构的学位或证书而使用过的材料。与我一同工 作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表 示了谢意。
签名: 12级 日期: 2D!C o/.ù 1-
关于论文使用授权的说明
本人完全了解西北师范大学有关保留、使用学位论文的规定,即:学 校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论 文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 (保密的论文在解密后应遵守此规定)
签名: 如教 导师签名: 甘J韭 日期: JrJ? ,06.以
西北
西北师范大学硕士学位论文
摘 要
近年来,随着智能设备发展的如火如荼,也带动了人机交互这一核心组成部分的进 步。人机交互从之前的手势、手指操作也逐渐向语音这一人类最为自然、便捷、高效的 交流方式上转变。语音作为人机交互的方式包括两方面内容,第一是让机器发出声音, 这是语音合成的研究范畴,第二是让机器理解人说的话,这里面又包括能听懂人类发音 的语义信息,称之为语音识别;或者能让机器辨别出是谁在说话,称为说话人识别,这 也是本文的研究目标和重点之一。目前语音合成和语音识别已经较为普遍地应用到智能 和其他一些设备上,但是能让机器区分出是谁在说话的说话人识别技术虽然在实验室条 件下的研究较为成熟,但是其在日常应用中较少出现,不过其广阔的应用前景使嵌入式 相关的说话人识别逐渐成为当下的研究热点。
ARM 作为目前最为常用的嵌入式处理器,具有低功耗、低成本、高性能的优点。并 且其外设端口丰富,有利于开发多功能系统。本课题的主要任务是利用现有的资源,选 择合适的说话人识别算法,最终实现具有较好实时性与准确性的说话人识别系统。
本文提出了基于 ARM 的说话人识别系统的研究和设计,主要工作包括理论知识研 究、确定系统方案、编写系统软件和整体设计实现四个部分。本文首先对相关数字信号 处理方面的知识做了介绍,接着对准确率和实时性的问题进行了考量,在理论算法部分
选择了 MFCC,GMM,UBM 等算法,最后通过 C++语言实现对说话识别处理中的预处 理、Mel 频率倒谱系数特征提取、GMM 模型的训练以及对说话人辨认和确认的识别。
本文硬件系统电路包括三星 S3C6410 处理器以及 FLASH 存储器、SDRAM、UDA1341TS 音频处理芯片、LED 显示等结构。在分析了 Linux 操作系统驱动程序的工作原理的基础 上,研究了嵌入式 Linux 下驱动程序的开发过程,建立了交叉编译环境,完整的开发出 UDA1341TS 音频编解码芯片在本系统中的驱动程序,以及 GPIO 口的相关驱动,将说 话人识别程序和驱动程序经过交叉编译产生的可执行程序下载到实验板上测试运行。经 测试表明该系统能实时的采集语音信号,完成对说话人的判断,同时系统具有良好的准
确度与实时性,且性能稳定,实现了系统小型化的整体设计方案,具有良好的发展空间。
关键词:说话人识别;Mel 频率倒谱系数;高斯混合模型;ARM
I
基于
基于 ARM 的说话人识别系统的研究和实现
Abstract
In recent years, with the development of smart devices in full swing, also led to advances in human-computer interaction of the core components. HCI from the previous gestures, finger operation has also been voice, the most natural, convenient and efficient way of human’s communicating. As human-computer interaction by voice includes two aspects, the first is to make the machine sound, this is the research areas of voice synthesis, and the second is to make machines understand what people say, there is also includes to understand semantic information, called the speech recognition; or let t
您可能关注的文档
- 基于ARM的多功能综合通信控制软件设计-电子与通信工程专业论文.docx
- 基于ARM的多路智能温度控制器的设计与研究-检测技术与自动化装置专业论文.docx
- 基于ARM的多协议矿用网关设计与实现-通信与信息系统专业论文.docx
- 基于ARM的多总线协议转换器的研究与设计-仪器科学与技术专业论文.docx
- 基于ARM的防伪读码器的设计与实现-机械制造及自动化专业论文.docx
- 基于ARM的非接触式CPU卡读写器系统的设计与实现-微电子学与固体电子学专业论文.docx
- 基于ARM的非视线范围内道路交通监测与预警系统设计-电路与系统专业论文.docx
- 基于ARM的分布式工业信号采集模块的研究-控制科学与工程专业论文.docx
- 基于ARM的风机和水泵节能系统设计与实现-计算机科学与技术专业论文.docx
- 基于ARM的钙离子自动测试仪的研究-微电子学与固体电子学专业论文.docx
- 2025年全国保密教育线上培训考试题库必刷题带答案详解(培优).docx
- 2025年押题宝典全国保密教育线上培训考试题库完美版附答案详解.docx
- 2025年全国保密教育线上培训考试题库检测试卷(模拟题)附答案详解.docx
- 全国保密教育线上培训考试全真模拟模拟题有答案详解.docx
- 全国保密教育线上培训考试强化训练题型汇编(夺分金卷)附答案详解.docx
- 2025年整理全国保密教育线上培训考试题库及完整答案详解(夺冠).docx
- 2025年全国保密教育线上培训考试题库检测试卷及答案详解【名校卷】.docx
- 2025年整理全国保密教育线上培训考试题库含答案详解(能力提升).docx
- 全国保密教育线上培训考试强化训练及参考答案详解(完整版).docx
- 2025年全国保密教育线上培训考试题库高频难、易错点模拟试题含答案详解(满分必刷).docx
最近下载
- 专题08 名著阅读(两部名著)-【好题汇编】备战2023-2024学年八年级语文上学期期末真题分类汇编(江苏专用)(解析版).docx VIP
- 数据库管理与开发项目教程杨云课后参考答案.docx VIP
- 智能机器人系统:智能机器人SLAMPPT教学课件.pptx VIP
- 土木工程施工方案.docx VIP
- GB_T 9711-2023石油天然气工业 管线输送系统用钢管.doc VIP
- 大学“十五五”时期党的建设专项规划.docx VIP
- 《中医入门,秦伯未著.doc VIP
- 2024小红书餐饮行业方法论报告.pdf
- 专题02 名句默写(四大题型)-【好题汇编】备战2023-2024学年八年级语文上学期期末真题分类汇编(江苏专用)(原卷版).docx VIP
- 第四章平面问题的极坐标解答作业点评1演示文稿.pdf VIP
原创力文档


文档评论(0)