以压缩感知为基础的语音数字编码技术.docVIP

以压缩感知为基础的语音数字编码技术.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档,助力人生,欢迎关注小编! 以压缩感知为基础的语音数字编码技术 打开文本图片集 摘 要:语音通信是当前社会发展中基本通信方式之一,实现高质量语音通信的根本在于计算机、电子技术等相关科技领域的发展。文章指出语音数字编码技术主要用于将原本模拟信号的语音转化为数字信号形式,方便用户对语音进行处理、传输以及存储。文章基于压缩感知,对语音编码技术进行详细分析。 关键词:压缩感知;基础;语音数字;编码技术 压缩感知技术能够实现对信号在采样的同时进行压缩,因此,受到信号处理行业的重视。对于数字语音处理来说,采样之后的量化编码是比较重要的一部分,在这样的背景下,本文以压缩感知作为基础,研究语音数字编码技术,希望以此能够为相关人士提供参考。 1 概述压缩感知 压缩感知,又名压缩采样、稀疏采样,从本质上来讲是查找欠定线性系统的一种稀疏技术,这项技术被广泛应用于电子工程领域,尤其是在信号处理方面。工作原理是信号具有稀疏特性,与奈奎斯特理论相比较,可以从比较少的测量中还原出原本想要获得的信号。核磁共振是一个比较典型的例子。 2 基于压缩感知技术下系数表示的语音压缩感知编码研究 2.1 稀疏表示理论 随着科学技术的发展,传感器技术应运而生,多数领域在发展中存在数据不断增长情况,例如音频、视频、地震等数据信息,如何对以上数据进行有效处理,使其表达方式更加简洁以及自适应,已逐渐成为当前信号处理行业重要问题之一。小波理论背景下的分解思想主要表达的是自适应选取特征。假设信号为s∈RN,L个N维长度向量d为字典D,表达式为D={d,∈RN,‖dγ‖=1,1≤γ≤L},给定字典后,信号s的线性组合表达式为: 也可运用分解逼近形式来表示信号: α为展开系数,R(k)为经过k项之后的残差,若KL时,信号残差R(k)处于0或几乎接近于0状态下,K个原子与其他展开系数就会将信号基本特征体现出来。为找到系数信号的表示形式,可将L0范数度量应用其中,这时候信号s的稀疏表示模型为: 上述表达式中α=[α1, α2, α3, …, αL],指系数展开后的向量组成,‖a‖0为a的L0范数,代表系数α非零元素个数。基于此,要想切实保证稀疏具备相应的稀疏度,就需要对维度k的大小进行合理固定,促使信号接近于模型min‖s-Da‖22 s.t.‖a‖0≤K,这种情况下,a处于绝对稀疏状态,稀疏度为KL,而信号s可稀疏表达式为: 2.2 冗余字典 2.2.1 基于调和分析的字典 通过展开某种类型的固定基,将其使用于信号中某种类型的结构特征,不适用于局部变化大的信号。一般来说,这种方式需要定义与该信号结构特征两者相匹配的时频原子,主要是通过固定窗函数w(t)平移、拉伸以及调制的方式获取的,因此,要想确保时域局部性,就需要固定窗函数w(t)满足以下几点要求[1]: (1)固定窗函数w(t)必须为连续可为实函数。(2)‖w(t)‖=1。(3)w(t)=。(4)dt≠0 and w(0)≠0。 之后对时频原子簇定义为: 在上述表达式中,γ=(s, u, ζ),尺度、平移、频率3种参量分别为s0, u, ζ。假设w(t)为偶函数,在坐标u集中已知能量,同时已知能量的集中程度与尺度s两者成比例,这时候w(t)可转变为: 因w(w)也属于偶函数,这使得能量集中位置在对称轴w=ζ附近。通过对以上两个观察式进行探究发现,时频原子不管是在时域上,还是在频域上,都具备相应的局部性。运用这种方法构成冗余字典,一方面能够切实满足信号的特征;另一方面对某类信号进行有效分解。从本质上来讲,这种类型的字典生成方式主要是通过对参数进行调整,以此为基础对原子时频特性进行相应的调整,所产生的字典具有结构强、可选性大以及对各种异性结构进行有效稀疏表示等特征,在图像消噪、压缩等领域中已取得相应进展[2]。 2.2.2 基于样本训练的字典 基于样本训练的字典、不需要提前对字典原子表达式进行定义,但在通常情况下,经常会存在各种复杂约束代价函数,正则理论也因此导入。 当前比较流行的算法为K-SVD算法,也是K-Means算法扩大化,当字典中一个原子的近似表示为K-SVD算法时,就会退化为K-Means算法。从性质上来讲,这种算法主要是运用奇异值的方式进行分解,代替原有对逆矩阵进行求解的方式来获取更新原子,在圖像消噪领域中获得良好的应用。除以上集中算法之外,还有ODL算法、RLS-DLA字典学习算法、Analysis K-SVD算法等,以上得到的字典都属于非结构性字典,而在大部分算法中,主要包括两种,一种为稀疏分解,另一种为字典更新,其中,字典更新这种算

文档评论(0)

wh45814 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档