- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[马克思主义方法论在论文中的应用
马克思主义与社会科学方法论论文设计
学生信息 姓名 学号
院系 专业
邮箱 电话 论文题目 视频解码器在异构系统上的实现及并行优化随着视频内容清晰度和视频编码标准复杂度的不断提升,视频实时播放对设备性能需求越来越高。近年来,随着GPU(Graphic Process Unit,图形处理器)硬件的飞速发展,如何充分利用GPU的强大的计算能力。为了减少了不同异构平台间的差异,统一异构平台规范,、ntel,,AMD等业界巨头联合制定了开放运算语言OpenCL标准。它提供了一个面向系统通用目的并行编程的开放式、免费标准,为视频解码器的优化提供了机会。
在.264解码过程中,去块滤波(deblocking filter)部分耗时通常占整体耗时的10%到40%左右。如果能对其进行有效的优化,对整体解码速度将会有明显的提升。然而
本文采用两种并行策略。第一种是传统的2D-wavefront方法,通过对顺序滤波过程的分析,在保证整个滤波过程中宏块间数据依赖的情况下,尽量提升并行度,以提高滤波速度。第二种则是在画质和滤波速度中权衡利弊,以宏块间的依赖关系为代价,对所有宏块进行并发滤波操作,来进一步提高滤波速度。
本文针对FFmpeg中的H.264解码器,分别采用上述两种策略对滤波过程进行并行化改进。实验结果表明,第一种策略由于滤波时核函数发射次数过多,相比CPU单线程慢了20多倍,第二种策略在不考虑内存传输耗时的情况下,滤波速度相比CPU单线程提高了0%左右
研究.264解码器在GPU上的优化实现,在开发成本、功耗、系统效率以及普及标准方面都有重大意义。
在开发成本方面,GPU的通用计算的开发成本与软件开发类似,远低于硬件开发成本,因此更新更快,在修复bug、改善性能上都能更快的响应。
在效率方面,由于解码工作转移到GPU执行,那么CPU的负载下降,那么CPU则可以同时做别的工作,整体系统的流畅度也会随之上升。
在普及标准方面,H.264解码器的优化可以使更多设备能够支持新修订标准编码视频的解码工作。这样能够使得新修订的普及工作更加顺畅,让更多的终端用户享受到新修订带来的技术优势。
尽管如此,由于解码流程中的存在复杂的数据依赖,如果不能很好的处理这些依赖,尽可能提高并行度,在解码速度上并不会有太大的提升,甚至反而会下降。如果能有效的解决数据依赖问题,提高并行度,对将来视频编解码也会有好的一面。
Abstract II
目录 III
1 绪言
1.1 课题背景
1.2 课题研究的目的和意义
1.3 国内外概况
1.3.1 视频编解码
1.3.2 GPGPU
1.3.3 相关研究
1.4 课题的主要研究工作
2 视频编码与OpenCL
2.1 H.264
2.1.1 环路滤波
2.2 OpenCL
2.2.1 OpenCL架构
2.2.2 OpenCL运行时
2.2.3 OpenCL存储层次
3 宏块并行策略
3.1 基本思路
3.2 优化方案
3.2.1 减少分支
3.2.2 工作组调度
3.2.3 内存访问
3.3 实验结果
3.4 本章小结
4 不考虑依赖的宏块级并行
4.1 基本思路
4.2 内存传输性能分析
4.2.1 Pinned内存与Paged内存
4.2.2 映射访问与直接访问
4.2.3 小结
4.3 实验结果
5 不足和展望
致谢
参考文献
本文主要的研究对象是H.264编码中的去块滤波部分。在H.264解码过程中滤波所占比率通常达到了整个过程耗时的20%到40%左右[2][3],在H.264的解码过程中仅次于运动补偿(Motion Compensation)。运动补偿虽然在解码过程中占用时间最多,但是相比去块滤波,其每个宏块的计算量太大,不太适合GPU的小粒度的大规模并行。因此本文选择去块滤波部分作为具体研究对象,尝试基于OpenCL平台对其进行优化。
随着视频信息的爆炸性增长,视频压缩亟待发展。更大的压缩比带来的则是编解码所需的更大的计算量。而与此相对的,GPU的计算能力不断上升,加上GPU通用计算技术的不断成熟,利用GPGPU来优化视频解码有着良好的前景。然而在利用GPU通用计算技术优化视频解码的过程中存在着很多问题,比如大并行度所需的数据不相关性,以及异构系统中的带宽限制等问题都制约着GPU视频解码的发展。
本文在OpenCL平台上对FFmpeg的H.264视频解码器的去块滤波部分进行了并行优化。本文的主要
您可能关注的文档
- [税务会计日常工作流程一.doc
- [马克思主义基本原理概论单选题及答案1.doc
- [税务案件证据收集.doc
- [新中国的外交2.ppt
- [八年级下册古诗.doc
- [税务登记表适用临时税务登记纳税人.doc
- [马克思主义基本原理概论在线考试.doc
- [新中国初期的外交.ppt
- [马克思主义基本原理概论复习.doc
- [新中国初期的外交建树.ppt
- 浙江金沃精工股份有限公司轴承套圈产研园项目(轴承套圈热处理生产线建设项目)环境影响报告表.docx
- 金华市河盘桥增效扩容改造工程环境影响报告书.docx
- 蒙速办电子证书下载操作流程.doc
- 嘉兴市科源塑料制品有限公司年产3000吨高档功能材料膜片技改项目环评报告.docx
- 嘉兴隆硕机械科技有限公司年加工输送设备400台新建项目环评报告.docx
- 桐乡市洁灵贸易有限公司年产空气过滤器1000万只新建项目环评报告.docx
- 大件路外绕线(天府新区货运大道)双流段建设工程项目环评报告.docx
- 5MWp屋顶分布式光伏项目可行性研究报告.docx
- 铁路工程施工招标资格预审文件示范文本.doc
- 铁路建设项目勘察设计招标文件示范文本.doc
文档评论(0)