信息技术 智能媒体编码 第10部分:实时语音.pdf

信息技术 智能媒体编码 第10部分:实时语音.pdf

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

信息技术智能媒体编码第10部分实时语音

1范围

本文件规定了面向下一代实时语音通信的解码过程。

本文件适用于在线会议、协同办公、社交、互动娱乐等领域。

2规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。

凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB/T5271.1信息技术词汇第1部分:基本术语

GB/T33475.3信息技术高效多媒体编码第3部分:音频

GB/T41867信息技术人工智能术语

3术语和定义

GB/T5271.1、GB/T33475.3和GB/T41867中界定的以及下列术语和定义适用于本文件。

3.1

保留reserved

在定义编码位流中的暂时未被使用的字段,可能在将来的标准扩展中被用到。

3.2

位率bitrate

编码位流传输到解码器输入端的速率。

3.3

位流bitstream

用作数据编码表示的有一定次序的一组二进制序列。

3.4

编码coding

读入音频采样流,并产生一个符合本文件的有效位流。

3.5

编码器coder

1

编码处理的实体。

3.6

采样频率samplingfrequency

每秒从连续信号中提取离散信号的采样个数。

注:单位为赫兹(Hz)。

3.7

解码decoding

在本部分中定义的一种数据处理,即读入编码位流并输出音频采样值的过程。

3.8

解码器decoder

解码处理的实体。

3.9

熵编码entropycoding

信号数字表示中的一种变长无损编码,用以减少统计特性上的冗余。

3.10

声道channel

声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。

3.11

字节byte

8个比特的序列。

3.12

正交镜像滤波器组quadraturemirrorfilterbank

将信号分成子带信号实现分频效果的滤波器组。

3.13

深度神经网络deepneuralnetwork

由多层神经元组成的网络,通过权值可调的加权连接,接收输入数据并产生输出。

3.14

神经网络通道neuralnetworkchannel

卷积层提取特征时使用的卷积核的数量。

2

3.15

带宽扩展bandwidthextension

基于低频成分和边信息生成高频成分的编解码方法。

3.16

丢包隐藏packetlossconcealment

基于已恢复语音帧预测丢失帧的解码方法。

4约定

4.1概述

本部分中使用的数学运算符和优先级与C语言使用的类似。但对整型除法和算术移位操作进行了特

定的定义。除特别说明外,约定编号和计数从0开始。

4.2算术运算符

下列算术运算符适用于本文件。

+加

-减(二元运算符)或取反(一元前缀运算符)

×乘

b

a幂,表示a的b次幂,也可表示上标。

a

除法运算,不做取整或四舍五入。

b

x平方根

b

f(i)自变量i取由a到b(含b)的所有整数值时,函数f(i)的累加和。

ia

log2以2为底的对数

4.3逻辑运算符

下列逻辑运算符适合于本文件。

||逻辑或

逻辑与

!逻辑非

4.4关系运算符

下列关系运算符适用于本文件。

大于

大于或等于

您可能关注的文档

文档评论(0)

**** + 关注
实名认证
内容提供者

资料大多来源网络,仅供交流与学习参考, 如有侵犯版权,请私信删除!

1亿VIP精品文档

相关文档