基于cmdct的aac编码器心理声学模型的改进 improvement of aac psychoacoustic model based on cmdct.pdfVIP

下载本文档

9
0
约1.22万字
约 5页
2017-08-13 发布于上海
举报
版权申诉

基于cmdct的aac编码器心理声学模型的改进 improvement of aac psychoacoustic model based on cmdct.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于cmdct的aac编码器心理声学模型的改进 improvement of aac psychoacoustic model based on cmdct

第12卷第6期电路与系统学报 V01．12No．6 2007年12月 JOURNALOFCIRCUITSANDSYSTEMS Decen由er，2007 文章编号：l007·0249(2007)06一oo引·04 基于CMDCT的AAC编码器心理声学模型的改进★ 李果，郭立，林海涛 (中国科学技术大学电子科学与技术系，安徽合肥230026) 摘要。本文提出一种改进的MPEG一2／4 构里感知模型和编码器中的时域到频域变换的计算都基于CMDcT进行，将两次变换合并为一次。在保持编码质量的同时，降低了变换部分的计算复杂度。新结构中变换的计算形式得到统一，更加适合编码器的vLsI实现。关键词。从c编码；心理声学模型；复MDcT(cMDcT) 中图分类号·TN9ll 文献标识码-A 1 引言 IsO／IEC 当前最为强大的音频编码算法，能在每声道64kbps的比特率上提供“透明的”质量【l】。 AAC编码算法的计算量巨大，为保证编码业务的实时性，以适应网络与手持设备应用场合的需要，必须对标准提供的AAc编码结构进行优化。加快算法速度有两个途径：一是在编码结构不变的情况下，在各模块的实现中采取快速算法，并针对平台进行代码优化；二是对编码结构进行调整。ISO标准只对编码码流的句法做出了规定，并未限定所采用的算法，可以在采取不同于标准附录中提供的参考算法的同时保持与标准的完全兼容。按照标准附录提供的参考结构【2】，输入信号进入AAc编码器中要进行两路平行的时域到频域的变换：一是进入分析滤波器组经MDCT分解得到信号的频域描述，另一路进入心理声学模型，根据DFT 分解所得的频谱计算掩蔽阈值等项。Yewang提出了将两路变换合并的思路[3】’Tsung．HanTsai等在心信号的性质p1带来了困难。可得到MDCT谱系数。这样在简化计算量的同时，保证了不可预测性的计算。本文的安排如下：第2部分为AAc标准参考编码结构中的感知模型计算；在第3部分中引入CMDcT 的概念，并对它与DFT的关系进行了分析；第4 部分介绍改进的编码结构及其性能分析；实验结果在第5部分中给出；最后一部分为结论。 2 MPEG．2AAC的编码结构 Is0／IEc ISO／IEC13818．7附录B中提供了一个参考图l 13818．7提供的参考编码结构编码结构。AAc编码器中，待编码的数据要进入两条并行的数据通路：一条是送入编码器，经过分析滤波器组、TNs／立体声／预测等频域处理工具、量化、哈夫曼编码、数据打包等处理之后得到AAC码流；另一条则是进入心理声学模型II，以利用频域／时域掩蔽效应降低码率。不妨称第一条通路为编码 ‘收稿日期·2004·11-01修订日期：2005-Ol一23 万方数据电路与系统学报第12卷 AACMain 通路，第二条为参数通路。图1为MPEG．2 Profile编码器的流程图，其中粗箭头表示码流的流向，细箭头表示参数的流向。感知模型和编码器的计算、处理都在频域中进行，两条数据通路中分别进行时域到频域的变换，因此对某一帧数据进行编码的第一步即是取该帧及其下一帧数据，共2048个样点。根据输入信号的性 ∥=6；对于短窗，卢=4)，以减少边界效应。得到的MDCT谱系数作为之后编码器各工具处理的对象。感知模型对参数的计算也是基于信号的频域表示进行的。ISO参考编码结构中，感知模型计算是域表示。在进行傅立叶变换之前，需对时域样点加Hann窗。对应MDCT可能采取的两种区间类型，感间类型所需要的比特数。这些参数将被编码通路中各工具使用，从而利用心理声学的原理提高编码效率。参考结构中共需进行两次时域到频域变换的计算，而感知模型中心理声学参数的计算只需要利用 DFT谱的前半部分：这中间进行了冗余计算。本文的目标即是将这两次变换统一为一次基于时域混叠 Domai