- 1、本文档共71页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
I
I
基于矢量量化文本无关说话人识别系统的设计和实现
摘 要
说话人识别是指通过对说话人语音信号进行相应的分析处理 提 取相应的特征或建立相应的模型 然后据此做出判断 自动确定说 话人是否在所记录的说话人集合中 进而确定说话人是谁的过程
根据是否预先确定识别用发音内容 说话人识别又分为文本相关
和文本无关的说话人识别 目前 用于说话人识别的方法有如下几 种 基于模板的说话人识别 基于矢量量化的说话人识别 基于高 斯混合模型的说话人识别 基于隐式马尔柯夫模型的说话人识别和 基于人工神经网络的说话人识别等 本课题依托实际项目 在原有 的理论基础上 结合委托单位具体要求 使用基于矢量量化文本无 关说话人识别方法开发出一个实用化文本无关说话人识别系统
作为一个实用化系统 本系统在设计和实现阶段充分考虑了委托
单位对识别率 识别速度 系统容量和抗噪能力等方面的需求 选 择和改进了相关算法 系统选择 LPC 倒谱作为识别的主要特征 使 用长时频谱作为辅助特征 针对特征码本聚类时 LBG 算法容易陷入 局部极小点的缺陷 系统在模拟退火算法的基础上 采用了 LBG 结 合模拟退火的算法进行聚类 实践证明该算法保证了码本的质量
为了实现在实际环境中的实时识别 系统先采用了静音检测技术探
测有效语音片断 然后使用更精确的端点检测技术进行更精确分析
II
II
针对环境多变性以及在实际使用中容易遭受环境噪声 信道失真
说话人个性特征和发声变形等环境因素的对说话人识别系统的干扰
与影响 系统采取了基于语音失真框架模型的自适应算法来不断修 正说话人码本以纠正偏差
论文以系统的实用化为核心 阐述了系统的原理 系统技术的选
用与改进以及系统的设计和实现 本文由六部分组成 第一章绪论, 对说话人识别系统的概念 发展状况 存在的问题以及用户需求进 行了阐述 第二章主要介绍了说话人识别系统的原理和一般系统结 构 第三章对系统选用和改进的技术进行了详细分析 第四章对系 统设计进行了阐述 包括系统模型 各模块分析以及自适应算法设 计 第五章阐述了系统的具体实现和实测数据分析 最后一章为总 结和展望
关键词 矢量量化 说话人识别 模拟退火 端点检测 自适应
PAGE
PAGE IV
DESIGN IMPLEMENT OF
TEXT-INDEPENDENT SPEAKER RECOGNITION SYSTEM BASED ON VECTOR QUANTIZATION
ABSTRACT
Speaker recognition analyses speaker’ s speech signal and extracts its feature or builds its model with which it can judge whether the speaker is in the users set and find it out.
According to whether speech content is given, Speaker recognition is classified to text-dependent and text independent recognition. Presently, these are several methods used in speaker recognition: method based on template, vector quantization, GMM, HMM, and NN etc. This article expatiates on an accomplished practical speaker recognition system based on vector quantization according to demands from consigning unit.
To be a practical system, when designed and developed, I selected and ameliorated some algorithms to fulfill the demands from consigning unit such as recognition ratio, recognition speed, system capacity and noise filtering. LPCcepstral is chose to be the main feature for recognition, and spectrum is an assistant feature. In allusion to the disfigure
您可能关注的文档
- 基于内容与形式要素的政务微博塑造政府形象策略研究-设计学专业论文.docx
- 基于通用可重构处理器的图像并行配准技术研究-微电子学与固体电子学专业论文.docx
- 基于遥感与GIS的河北省沽源县土地退化监测与风险评价-第四纪地质学专业论文.docx
- 基于特征提取的钢坯号字符电子显示与编码识别-机械电子工程专业论文.docx
- 基于视频图像理解中国象棋棋子识别-应用数学专业论文.docx
- 基于人工神经网络方法的上市公司股票投资价值分析-金融学专业论文.docx
- 基于问题学习(PBL)的教学模式在基础医学教学中理论与实践的研究-学科教学·生物专业论文.docx
- 基于网盘的移动僵尸网络命令与控制机制研究-信息安全专业论文.docx
- 基于临床诊疗决策的知识推理引擎研究与实现-计算机软件与理论专业论文.docx
- 基于声子晶体滤波的光纤振动传感器分析-光学工程专业论文.docx
- 新视野二版听说1第6单元示范1课件.ppt
- 【参考答案】 联络口译(第二版) 《联络口译》(第二版)参考答案.pdf
- 梅大高速茶阳路段“5·1”塌方灾害调查评估报告.docx
- 虹吸雨水PE管施工节点标准做法.pdf
- 2025消防设施施工质量常见通病防治手册,典型图示+规范要求.pptx
- 新视野大学英语(第二版)读写教程 4 空军工程大学编U05B.ppt
- E英语教程2(智慧版)Unit 6.pptx
- E英语教程3(智慧版)Unit 7.ppt
- 新视野二版读写1第4单元课件Section A How to Make a Good Impression.pptx
- E英语视听说教程4(智慧版)4-U2课件(2024版)U2.pptx
最近下载
- 2021年首届北京市大学生模拟法庭竞赛16进8淘汰赛赛题(二).docx VIP
- 2025年无锡工艺职业技术学院单招职业适应性测试题库及参考答案.docx VIP
- 旋元佑文法(2019新版)-01第一章 基本句型.docx
- 【地理】2023年云南省昆明市初中学业质量诊断性检测试题(解析版).pdf VIP
- 城市热岛效应.pptx VIP
- 小学科学新教科版一年级下册全册教案(2025春).pptx.doc
- 高教版 职业道德与法治 第四课在工作中做合格建设者.pptx VIP
- 固态法白酒行业深度研究分析报告(2024-2030版).docx
- 2025年高中生物研究性课题研究报告范文.pdf VIP
- 中山大学肿瘤学硕士复试试题.doc
文档评论(0)