信息技术先进音视频编码第11部分同步文本》(征求意见稿.doc

信息技术先进音视频编码第11部分同步文本》(征求意见稿.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息技术先进音视频编码第11部分同步文本》(征求意见稿.doc

国家标准《信息技术 先进音视频编码 第11部分:同步文本》 (征求意见稿)编制说明 1、工作简况 在国家标准计划中,AVS标准的正式名称为《信息技术 先进音视频编码》,国标号为GB/T 20090。AVS标准包括系统、视频、音频、数字版权管理、文件格式等多个部分。AVS标准是针对中国音视频产业的需求,由中国数字音视频领域的科研机构和企业牵头,相关国际组织和企业广泛参与,按照国际开放式规则制定的标准。 本部分是GB/T 20090的第11部分,本部分国标计划号为T-469。本部分由全国信息技术标准化技术委员会归口,数字音视频编解码技术标准工作组负责组织起草,正式名称为《信息技术 先进音视频编码 第11部分:同步文本》(简称AVS同步文本)。 本部分的正式制定起始于2007年12月于上海召开的AVS工作组第23次会议。在该次会议上,AVS工作组讨论并接收了需求提案“AVS同步文本需求”(M2187),会后输出了正式的需求文档(N1457)和技术提案征集书(N1458)。本次提案建议增加用于定义AVS同步文本的编码格式,并给出相关技术要求。最终需求组建议在AVS系列标准中增加一个新的部分-同步文本。 AVS工作组第二十五次会议(2008年6月,厦门)有条件接收了AVS同步文本提案(M2400),建议具体给出同步文本在应用场景描述(即AVS第12部分:综合场景)中的使用方法,另外还需要考虑同步文本的参考软件。提案M2400介绍了AVS同步文本的技术框架以及编码格式。 AVS工作组第二十八次会议(2009年3月,杭州)讨论了AVS同步文本的标准草案M2544。本次草案在M2400的基础上对样本描述部分的编码格式定义做了一些细节修改。会议结论为,草案格式仍需要修改,建议下次会议作为提案重新提交。 AVS工作组第二十九次会议(2009年6月,绵阳)收到了修改后的AVS同步文本草案(M2583)。本次提案在M2544的基础上修订了格式,提案的描述语言也更加规范。会议结论为,会后将该草案作为CD输出。 在AVS工作组第三十五次会议(2010年12月,深圳)上,对同步文本CD文档进行了讨论和整理,会后作为FCD输出。 2012年2月12日,AVS工作组就本部分进行了为期90天的内部审阅。 本部分起草单位:中国科学院计算技术研究所、???京大学、北京邮电大学。 本部分主要起草人:高文、黄铁军、牟伦田、霍龙社、周晓聪、陈熙霖、王雷等。 2、标准编制原则和确定标准主要内容的论据,若标准中涉及专利,则应列出相关专利的目录及其使用理由 2.1 编制原则 在标准的编制过程中,遵循了以下原则: 先进性:所采纳的技术和所形成的体系结构能够代表和反映相关该领域的国际前沿水平; 现实性:算法和技术的实现成本是市场可接受的; 兼容性:与相关国际标准兼容,降低互连互通开销,便于AVS标准的推广应用; 前瞻性:面向相关技术领域和应用领域的发展方向,保证AVS标准的稳定性、持续性和可扩展性; 开放性:面向国内外征求技术提案,反对“闭门造车”。 2.2 标准的主要内容及论据 在通常欣赏的影视节目、卡拉OK等音视频媒体中,除了音频和视频之外,还有一个重要的组成部分就是文本,例如电影和电视剧中的字幕,卡拉OK中滚动显示的歌词信息等。这些文本信息与音频和视频一样需要按时间进行同步,即在播放的过程中文本信息的显示需要与音视频的播放保持同步。 传统在这项媒体中加入文本的方式是在媒体制作的过程中,把文本制作成图像叠加到视频中去。其缺点是灵活性差,制作和运营代价高,因为需要为不同语言的文本分别压制不同的视频码流,而且无法在中间环节定制文本内容。比如考虑这样一个用例,视频内容制作者为一部电影准备了十几种语言的字幕,终端用户根据自己的需要选择相应的字幕观看。如果按照上面的方法,就必须制作对应十几种语言十几个视频文件,这显然很不方便。因此一个较好的方法是把字幕等文本信息也独立出来,像音频和视频一样可以独立编码、存储、传输和播放,在播放时通过时间戳把三者联系和同步起来。 同步文本虽然没有视频和音频那么复杂和重要,但也跟它们一样属于组成媒体内容的基本媒体类型之一。虽然已有标准组织制订了与同步文本相关的标准,但是并不适合AVS直接借用。因此有必要在AVS标准系列中制订关于同步文本编码、存储的相关标准。 针对上述需求和目标,在明确了关键问题的基础上,提出并完善了解决方案,形成了最终的标准草案,具体内容如下: 同步文本显示属性 在同步文本的显示属性中,主要定义了同步文本的字符编码支持、字符集支持、字体支持、颜色支持、文本显示位置、字幕滚动模式和控制、编码语言、书写方向、特殊效果显示(如卡拉OK)等规范。 一个同步文本序列对应一个文本显示区域。同步文本显示于文本显示区域中的一个文本框

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档