- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
低码率视频编码算法的并行性与实时实现
低码率视频编码算法的并行性与实时实现
蒋晓宁, 王
进, 叶澄清
(浙江大学 计算机科学与工程学系, 浙江 杭州 310027)
摘 要: 讨论了计算密集型低码率视频编码算法 H. 263 的并行性问题, 根据它的数据相关性, 将其分解
为 7 个任务Λ 对算法最费时的运动向量搜索部分提出了快速算法Λ 针对 T I 的 TM S320C 80 多媒体多处 理器芯片, 讨论了调度策略Λ 最后给出了基于该芯片的实时实现结果Λ
关键词: 视频编码; 数据相关; 快速搜索; 并行调度
中图分类号: T P 301; TN 919
文献标识码: A
文章编号: (2001) 0220214206
近几年, 多媒体技术取得了巨大进展, 并得到广泛应用Λ 其核心技术之一的数字视频压缩编码
受到普遍重视Λ特别是关于视频信号的甚低码率编码是当前国际上的一个研究热点1 ~ 3 Λ这些新技
术的基本思想是基于对象进行编码, 很有发展前途, 但目前还不够成熟Λ继 ISO 和 ITU
等标准化组
织在制定M P E G1,M P E G2, H. 261 等视频编码国际标准之后, ITU 又于 1996 年公布了 H. 263Λ 它
是甚低码率通信的视频编码标准, 主要是针对普通电话网络 P STN (P u b lic Sw itch ed T e lep ho n e
N e tw o rk ) Λ H. 263 在视频会议系统、可视电话、远程医疗诊断、远程监控等领域存在着广阔的应用 前景Λ 它在 H. 261 基础上引入了半象素精度运动估值技术, 同时建议了四种可选的新技术, 从而改 善了编码性能, 大大地减少了 H. 261 在低码率应用时出现的方块效应Λ 本文主要针对 H. 263 进行
讨论Λ
H. 263 算法计算量很大4 , 要实时实现它有两种途径: 一是改进算法, 尤其是对占整个算法大 部分计算量的运动向量搜索算法的改进5, 6 ; 二是用强大的硬件支持Λ本文同时采用了这两种办法,
主要问题是算法与硬件的有机结合, 即对 H. 263 进行并行性改造, 并在 T I (T ex a s In st rum en t s) 的 多处理器芯片 TM S320C 808 上实现Λ
TM S320C 80 及 H.
263 概述
1
TM S320C 80 是美国德州仪器公司 T I 新推出的由 5 个独立运行的处理器组成的单片M IM D
多处理器系统, 其中 4 个是信号处理器 (D SP s) , 另一个是 R ISC 主处理器 (M P ) Λ其结构框图如图 1
所示, 除外部 RAM 外, 所有功能单元都位于片内Λ
C 80 含有有限数量的片内存储器和高速缓存Λ处理器能直接存取片内存储器, 对外部存储器的 存取由传输控制单元 (T C ) 来管理Λ 主处理器含有高速数据缓存, 从程序的角度看, 它可以透明地访 问外存Λ 而 4 个D SP s 则没有高速数据缓存, 因此, 要求 T C 将数据取入内存之后才能对其进行操作Λ H. 263 是一种基于块的编码算法Λ 将一幅图像分成 16×16 的宏块, 其中含亮度信息和色度信
息Λ 以宏块为单位进行运动估值, 对残差信号进行D C T 变换, 然后对结果进行量化和变字长编码Λ
其框图如图 2 所示Λ
H. 263 建议了 4 种可选的编码技术:
·基于语法的算术编码Λ
·高级预测模式Λ
第 2 期
蒋晓宁, 等: 低码率视频编码算法的并行性与实时实现
215
·无限运动向量模式Λ
·PB 帧模式Λ
H. 263 规定了最终比特流的语法、语义及解码过程Λ它并没有描述具体的编码过程Λ它是一个 开放的标准, 具体的编码过程留给实现者去竞争Λ
图 1
TM S320C 80 功能框图
F ig. 1 F unc t io n un it s o f TM S320C 80
图 2
H. 263 编码器框图
F ig. 2 H. 263 E nco de r
并行性
2
并行需要把算法分解为适当的任务, 以便通过适当的调度策略达到各处理器负载平衡, 从而使
系统的效率最高, 吞吐量最大Λ 在将 H. 263 进行并行性分解时, 要考虑到以下原则:
·数据相关性Λ 指一个操作需要另一个操作的结果Λ
·TM S320C 80 是一个M IM D 系统, 为了降低因同步而产生的大量开销, 调度的任务应是粗粒 度的Λ
·各处理器的内部 RAM 只有 6KB 字节, 为了避免数据在内部 RAM 与外部 RAM
换进换出, 宜将对同一数据进行处理的所有操作划分于同一任务中Λ
间频繁地
·对于实时实现, 编码延迟应尽量小Λ 一幅
文档评论(0)