基于cmdct的aac编码器心理声学模型的改进 improvement of aac psychoacoustic model based on cmdct.pdfVIP

基于cmdct的aac编码器心理声学模型的改进 improvement of aac psychoacoustic model based on cmdct.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于cmdct的aac编码器心理声学模型的改进 improvement of aac psychoacoustic model based on cmdct

第12卷第6期 电路与系统学报 V01.12No.6 2007年12月 JOURNALOFCIRCUITSANDSYSTEMS Decen由er,2007 文章编号:l007·0249(2007)06一oo引·04 基于CMDCT的AAC编码器心理声学模型的改进★ 李果, 郭立, 林海涛 (中国科学技术大学电子科学与技术系,安徽合肥230026) 摘要。本文提出一种改进的MPEG一2/4 构里感知模型和编码器中的时域到频域变换的计算都基于CMDcT进行,将两次变换合并为一次。在保持编码质量的 同时,降低了变换部分的计算复杂度。新结构中变换的计算形式得到统一,更加适合编码器的vLsI实现。 关键词。从c编码;心理声学模型;复MDcT(cMDcT) 中图分类号·TN9ll 文献标识码-A 1 引言 IsO/IEC 当前最为强大的音频编码算法,能在每声道64kbps的比特率上提供“透明的”质量【l】。 AAC编码算法的计算量巨大,为保证编码业务的实时性,以适应网络与手持设备应用场合的需要, 必须对标准提供的AAc编码结构进行优化。加快算法速度有两个途径:一是在编码结构不变的情况下, 在各模块的实现中采取快速算法,并针对平台进行代码优化;二是对编码结构进行调整。ISO标准只 对编码码流的句法做出了规定,并未限定所采用的算法,可以在采取不同于标准附录中提供的参考算 法的同时保持与标准的完全兼容。 按照标准附录提供的参考结构【2】,输入信号进入AAc编码器中要进行两路平行的时域到频域的变 换:一是进入分析滤波器组经MDCT分解得到信号的频域描述,另一路进入心理声学模型,根据DFT 分解所得的频谱计算掩蔽阈值等项。Yewang提出了将两路变换合并的思路[3】’Tsung.HanTsai等在心 信号的性质p1带来了困难。 可得到MDCT谱系数。这样在简化计算量的同时,保证了不可预测性的计算。 本文的安排如下:第2部分为AAc标准参考编码结构中的感知模型计算;在第3部分中引入CMDcT 的概念,并对它与DFT的关系进行了分析;第4 部分介绍改进的编码结构及其性能分析;实验结 果在第5部分中给出;最后一部分为结论。 2 MPEG.2AAC的编码结构 Is0/IEc ISO/IEC13818.7附录B中提供了一个参考 图l 13818.7提供的参考编码结构 编码结构。AAc编码器中,待编码的数据要进入两条并行的数据通路:一条是送入编码器,经过分析 滤波器组、TNs/立体声/预测等频域处理工具、量化、哈夫曼编码、数据打包等处理之后得到AAC码 流;另一条则是进入心理声学模型II,以利用频域/时域掩蔽效应降低码率。不妨称第一条通路为编码 ‘收稿日期·2004·11-01修订日期:2005-Ol一23 万方数据 电路与系统学报 第12卷 AACMain 通路,第二条为参数通路。图1为MPEG.2 Profile编码器的流程图,其中粗箭头表示码流的 流向,细箭头表示参数的流向。 感知模型和编码器的计算、处理都在频域中进行,两条数据通路中分别进行时域到频域的变换, 因此对某一帧数据进行编码的第一步即是取该帧及其下一帧数据,共2048个样点。根据输入信号的性 ∥=6;对于短窗,卢=4),以减少边界效应。得到的MDCT谱系数作为之后编码器各工具处理的对象。 感知模型对参数的计算也是基于信号的频域表示进行的。ISO参考编码结构中,感知模型计算是 域表示。在进行傅立叶变换之前,需对时域样点加Hann窗。对应MDCT可能采取的两种区间类型,感 间类型所需要的比特数。这些参数将被编码通路中各工具使用,从而利用心理声学的原理提高编码效 率。 参考结构中共需进行两次时域到频域变换的计算,而感知模型中心理声学参数的计算只需要利用 DFT谱的前半部分:这中间进行了冗余计算。本文的目标即是将这两次变换统一为一次基于时域混叠 Domai

您可能关注的文档

文档评论(0)

hello118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档