- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
会议电视常用音频协议介绍及对比白皮书huawei
会议电视常用音频协议介绍及对比白皮书
一、数字化音频原理:
声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,
振幅对应于电平轴线。通常人耳可以听到的频率在20Hz到20KHz 的声波称为为可
听声,低于20Hz 的成为次声,高于20KHz 的为超声,多媒体技术中只研究可听声
部分。
可听声中,话音信号的频段在80Hz到3400Hz之间,音乐信号的频段在
20Hz-20kHz之间,语音(话音)和音乐是多媒体技术重点处理的对象。
由于模拟声音在时间上是连续的,麦克风采集的声音信号还需要经过数字化
处理后才能由计算机处理。通常我们采用PCM编码(脉冲代码调制编码),即
通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
1、采样
采样,就是每隔一段时间间隔读一次声音的幅度。单位时间内采样的次数称
为采样频率。显然采样频率越高,所得到的离散幅值的数据点就越逼近于连续的
模拟音频信号曲线,同时采样的数据量也越大。
为了保证数字化的音频能够准确(可逆)地还原成模拟音频进行输出,采样定
理要求:采样频率必须大于等于模拟信号频谱中的最高频率的2倍。
常用的音频采样率有:8kHz、11.025kHz、22.05kHz 、16kHz、37.8kHz、44.1kHz 、
48kHz 。
例如:话音信号频率在0.3~3.4kHz范围内,用8kHz的抽样频率(fs ),就可
获得能取代原来连续话音信号的抽样信号,而一般CD采集采样频率为44.1kHz 。
2 、量化
量化,就是把采样得到的声音信号幅度转换成数字值,用于表示信号强度。
量化精度:用多少个二进位来表示每一个采样值,也称为量化位数。声音信
号的量化位数一般是 4,6,8,12或16 bits 。
由采样频率和量化精度可以知道,相对自然界的信号,音频编码最多只能做
到无限接近,在计算机应用中,能够达到最高保真水平的就是PCM编码,通常
PCM约定俗成了无损编码。
3、编码
一个采样率为44.1kHz ,量化精度为16bit,双声道的PCM编码输出,它的数
据速率则为 44.1K ×16×2 =1411.2 Kbps ,存储一秒钟需要176.4KB的空间,1分
钟则约为10.34M,因此,为了降低传输或存储的费用,就必须对数字音频信号
进行编码压缩。
到目前为止,音频信号经压缩后的数码率降低到32至256kbit/s ,语音可以低
至8kbit/s 以下。
对数字音频信息的编码进行压缩的目的是在不影响人们使用的情况下使数
字音频信息的数据量最少。通常用如下6个属性来衡量:
—比特率;
—信号的带宽。
—主观/客观的语音质量;
—延迟;
—计算复杂度和对存储器的要求;
—对于通道误码的灵敏度;
为使编码后的音频信息可以被广泛地使用,在进行音频信息编码时需要采用
标准的算法。传统会议电视设备主要采用ITU-T推荐的G.711、G.722、G.728和
AAC_LD等音频标准。
二、常用音频协议简介:
1、 ITU -T G.728
1992年ITU-T发布的电话声音信号编码方式推荐标准。采用LD-CELP编码方
式,采样率为8KHz,以16kb/秒的速度传送声音信号,传送延迟时间极短,仅有
0.625 ms 的算法编码延迟。
2 、 ITU -T G.711
标准公布于1972年,其语音信号编码是非均匀量化PCM。语音的采样率为
8KHz,每个样值采用8bit量化,输出的数据率为64kbps。这种窄带编码支持对300
到 3,400赫兹的音频进行压缩。但虽然压缩质量不错,但是消耗的带宽相对较大,
主要用于数字PBX/ISDN上的数字式电话。
3、 ITU -T G.722
ITU-T G.722标准是第一个用于 16 KHZ 采样率的标准化宽带语音编码算
法,1984年被CCITT定义为标准,而且现今还在使用。.G.722 编解码器在 16 kHz
频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 64、56 与 48
Kbit/s,其总延迟约 3 ms,能够提供更好的通话质量。
G.722 的优点是延时和传输位误差率非常低,且没有任何的专利技术,费用低
您可能关注的文档
最近下载
- 人教版2024八年级下册物理9.4 跨学科实践:制作简易活塞式抽水机(教学设计).docx VIP
- 全国山西经济版小学信息技术第一册第三单元活动2《小蘑菇》说课稿.docx VIP
- 全国山西经济版小学信息技术第一册第三单元活动2《小蘑菇》教学设计.docx VIP
- 《四世同堂》的汉奸形象书写与国民性批判.docx VIP
- 曲臂车安全专项施工方案.docx VIP
- SAJ三晶VM1000H系列高性能变频器用户手册使用说明书0.75~9kW.pdf
- 低空经济产业园的综合建设方案.docx
- 道路交通事故认定书复核申请书.pdf VIP
- 铁路无人机培训课件.pptx
- 读书分享课件《三体》-刘慈欣.pptx VIP
文档评论(0)