- 1、本文档共136页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音压缩感知关键技术研究-信号与信息处理专业论文
南京邮电大学博士研究生学位论文摘要学科:工学 专业:信 号 与 信 息 处 理 研究方向:语音处理与现代语音通信技术 作者:2009 级博士研究生 孙林慧指导老师:杨 震 教授题 目:语音压缩感知关键技术研究Title: Research on the key issues of compressed speech sensing关键词:语音信号 压缩感知 过完备字典 多尺度压缩感知 基追踪Keywords: SpeechSignals;CompressedSensing;OvercompleteDictionary;Multiscale Compressed Sensing; Basis Pursuit本论文得到以下基金项目资助①国家重大基础研究计划 973 项目:“物联网混杂信息融合与决策研究”(编号:2011CB302903)②国家自然科学基金项目:“基于 Lp 优化的语音压缩感知理论和编码技术的研 究”(编号③国家自然科学基金项目:“鲁棒性压缩感知关键技术研究”(编号:④江苏省普通高校研究生创新科研计划项目:“基于压缩感知的欠定语音分离技 术研究” (编号:CX10B_191Z)摘 要语音是人类最方便直接的交流方式,在数字化的时代,如何对语音信号建模以获得更 少的采样但又不影响语音的质量,是当前语音信号处理领域中的研究热点。压缩感知(Compressed Sensing,CS)是基于信号在某个域的稀疏性建立的线性、非自适应采样的 新理论,表明具有稀疏性的压缩感知能获得更好的压缩性能,信号的稀疏性或可压缩性是 实现压缩重构的必要条件之一。由于语音信号具有可压缩性,能够采用低于 Nyquist 采样 的速率无失真地采样信号,基于压缩感知进行低速率无失真地采样给语音信号的采样、存 储、传输和处理都带来了很大方便。所以 CS 理论与语音信号处理领域的结合,意味着对 传统的基于奈奎斯特均匀采样定律下的语音分析方法的颠覆。用 CS 理论中的观测来代替 传统的 Nyquist 采样值,将导致信号特征根本性的变化,进而影响整个语音信号处理各种 应用的理论和技术体系。将 CS 应用于语音信号领域,来探求语音信号处理的各种新方法 具有很好的现实意义,而研究语音压缩感知中的各种关键技术是其走向实用的基础。本论 文的主要工作和创新如下:(1)根据语音信号在离散余弦(DCT)基下的稀疏性描述了基于正交基的语音压缩 感知的框架。基于此框架,对随机观测矩阵进行选择,并采用基追踪(BP)和正交匹配追 踪(OMP)算法对已压缩采样的语音信号进行重构,提出一系列结论:CS观测矩阵的维数(其决定了压缩比)、每帧语音信号选取的帧长的大小、分帧时采用的窗函数及帧移,都 对重构性能有影响。(2)基于语音信号帧内样值间的相关性和冗余域的稀疏性,采用离散余弦转换矩阵 及基追踪方法对压缩感知采样语音进行重构时,针对语音稀疏性不够好导致大压缩下采样 后重构效果差的缺点,本文提出采用过完备线性预测字典做转换矩阵,用基追踪重构算法 对压缩感知采样语音进行高质量重构。该方法预先由训练语音的预测系数聚类构造过完备 字典,不需要测试语音的预测系数;基于过完备线性预测字典重构信号性能良好。对利用 基追踪重构的语音进行了主客观评价,得出结论:同样的观测数目下,基于过完备线性预 测字典,比基于离散余弦变换矩阵压缩感知采样语音重构信噪比高出 3~8dB。(3)针对含白噪语音信号压缩采样后采用基追踪方法重构性能差的问题,在设计更 具鲁棒性的重构算法方面提出自适应基追踪去噪方法,该方法根据原含噪信号的信噪比自 适应选择重构最佳参数,从而在重构语音的同时提高原信号信噪比。并在此基础上提出自适应基追踪去噪并后置去噪方法。随后又提出前置去噪后基追踪重构方法,针对前置去噪提出了一种基于数据驱动字典和过完备稀疏表示的自适应语音增强方法,含噪语音增强之 后再采用基追踪实现含白噪语音的压缩感知。基于这三种方法实现含噪语音信号的压缩感 知,并对其性能进行比较。针对观测含有噪声的压缩感知问题,提出采用对观测噪声鲁棒 性较好的 ABPDN 重构算法,当语音观测含有噪声时,采用 ABPDN 算法重构信号性能优 于采用 BP 算法重构信号性能。(4)针对语音信号在小波域的压缩感知问题,在系数总长度不超过原信号长度的前 提下,推导了 Sym 小波分解合成的矩阵形式,提出了语音信号多尺度压缩感知(MCS) 系统框架。论文进一步分析语音信号在小波基下不同级的稀疏性,提出了一种自适应多 尺度压缩感知(AMCS)方法,并将这两种方法应用于语音压缩重构中,对重构语音进行 了主客观评价和说话人识别验证,得出结论:基于 AMCS 的压缩重构,比非自适应的 MCS 重构语音的性能好。关键词
您可能关注的文档
- 新风用地能降温除湿试验研究-供热、供燃气、通风与空调工程专业论文.docx
- 基于wcf的仓储管理系统研究与实现-计算机技术专业论文.docx
- 西妥昔单抗与放化疗联用对喉鳞癌细胞的协同杀伤效应的实验研究-耳鼻咽喉-头颈外科学专业论文.docx
- 论传统云纹在现代设计中的应用-设计艺术学专业论文.docx
- 基于物联网的城市路灯监控系统架构及相关技术实现-电路与系统专业论文.docx
- 绿色棉纤维葡萄糖苷转移酶基因(gh3gt4)与苯丙氨酸解氨酶基因(ghpal1)的克隆及表达研究-生物化学与分子生物学专业论文.docx
- 精益生产模式下的原料管理系统设计和应用-工业工程专业论文.docx
- 基于双目立体视觉的特征点匹配关键技术研究与应用-计算机软件与理论专业论文.docx
- 配电网最大供电能力的性质与影响因素-电力系统及其自动化专业论文.docx
- 基于边缘提取与颜色目标定位的图像检索算法-计算机应用技术专业论文.docx
- 2025-2030中国顺式3-己烯基丁酸酯行业市场发展趋势与前景展望战略分析研究报告.docx
- 2025年广东省惠州市惠阳区高三二模数学试卷及答案.docx
- 英语(提高卷01)(考试版A4).docx
- 2025-2030中国顺式3-己烯基丁酸酯行业市场发展趋势与前景展望战略研究报告.docx
- 2025年广东省惠州市惠城区高三英才班下学期数学限时训练试题.docx
- 2025-2030中国顺磁氧分析仪行业市场发展趋势与前景展望战略研究报告.docx
- 2025-2030中国顾问会计软件行业市场现状供需分析及投资评估规划分析研究报告.docx
- 2025-2030中国须后水行业市场发展趋势与前景展望战略研究报告.docx
- 2025-2030中国顶部入口搅拌器行业市场现状供需分析及投资评估规划分析研究报告.docx
- 2025-2030中国顶部入口混合器行业市场现状供需分析及投资评估规划分析研究报告.docx
文档评论(0)