- 1、本文档共113页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒体通信原理第二章
多媒体技术第2章 多媒体音频技术 本章主要内容 音频信号的相关概念 音频信号的基本概念;数字化方法;压缩编码的可行性与分类;声音类别与数据率… 音频信息压缩编码技术标准体系 G.7XX系列和MPEG-X系列 G.7XX声音压缩编码技术 各标准的编码方法;编/解码器等 MPEG-X声音压缩编码 电子乐器数字接口MIDI 2.1 音频信号 声音的产生源于物体的震动,这种震动引起物体周围气压的变化并传播,最后形成了声音。 声音是一种波,由两个参数描述: 频率:声音的尖锐程度。 振幅:声音的大小,又称响度。 音频信号是指处在20Hz~20kHz频率范围的声音。 音频信号 音频信号 根据音频信号占用频谱的不同,可以将音频信号分为3类: 1.语音信号:又称话音信号,是人在正常情况下发出的一种声音,频率范围大约为300Hz~3KHz,成年人多为60Hz-400Hz, 男声音调10ms,女声音调6ms。 2.音乐信号:各种乐器发出的声音,频率范围大约为20Hz~20kHz。 3.噪音信号:人们不感兴趣的一类声音,通常研究如何去掉它。 以上这些声音都可以称为波形声音。 通常声音的声强 通常声音的分类 音频信号的数字化 音频信号通常是连续信号,要利用计算机来处理,首先需要对其数字化。 音频信号的数字化 对声音信号进行采样时,一般使用音频范围的ADC(模数转换器)进行。不同的ADC主要区别于以下两个重要参数: (1)采样频率: 采样频率是指每秒钟采集声音样本的个数。它的取值应该满足Nyquist Theory,即采样频率fs应该大于等于声音信号中最高频率fm的两倍。 采样频率的单位是:Hz或samples/s。 如:数字电话的采样率为8KHz。 音频信号的数字化 (2)采样精度: 采样精度用样本位数来表示。 样本位数越多,则声音质量越高,因为每个样本的量化值与原样本值越接近。 采样精度的单位是:bits/sample。 音频信号的数字化 采样频率越高,采样精度越大,则数字化声音效果越好,但是需要的存储量就越大。因此在实际应用中,需要折中考虑声音质量和存储量的问题。 音频信号的数字化 声音硬件: 音频信号压缩编码的可行性与分类 对于高质量和长时间的音频数据,由于数据量都特别大,为了有效地存储和传输,需要进行压缩编码。 压缩的可能性存在于: (1)声音信号中包含大量的冗余信息,如样本相关性、时间周期相关性、基音相关性等。 (2)利用人的感知特性进行压缩。 (3)根据话音产生机理进行压缩。 音频信号压缩编码的可行性与分类 根据压缩编码思想的不同,把音频编码技术分为三类: (1)波形编码(Waveform Coding) (2)源编码(Source Coding) (3)混合编码(Hybrid Coding) 衡量语音编码性能的主要因素有: 编码质量; 编码速率; 算法复杂度。 音频信号压缩编码的可行性与分类 波形编码: 没有利用语音信号自身的特点。如: 1.CD质量音频数据量:2x44100x16 b/s 2.电话质量音频数据量:8Kx8 b/s(DPCM 56Kb/s;ADPCM 32Kb/s) 源编码: 参数化,利用语音信号的特点进行数据压缩。 例如:信道声码器的工作原理: 将语音信号基于语音分析原理分解成一系列频率分量,将这些分量在信道中传输。 音频信号压缩编码的可行性与分类 接收方基于收到的数据进行语音重建:将收到的数据中的频率分量作为语音的基频,产生一系列脉冲作为浊音,用噪声发生器的输出作为清音。 此方法可以将语音的传输速率降低至3Kb/s。 混合编码: 如:利用语音识别和语音合成系统构建的语音压缩。 声音类别与数据率 声音根据频带分为5类: (1)电话(Telephone)声音 (2)调幅(Amplitude Modulation)广播声音 (3)调频(Frequency Modulation)广播声音 (4)数字音频光盘(CD-Audio)声音 (5)数字录音带(Digital Audio Tape)声音 这些不同的声音数据区别于采样频率、采样精度、通道数、数据率和频率范围等参数。 声音类别与数据率 声音类别与数据率 我们所熟悉的数字音频文件格式如下表所示: 声音质量的度量 声音质量的度量分为:客观质量度量和主观质量度量。 声音客观质量的度量用信噪比来展开: 信噪比越大,声音质量越好;反之,信噪比越小,声音质量越差 声音主观质量的度量是利用人的感觉(听觉)来进行度量,通常分5分: 1分:劣(极反感);2分:差(讨厌但不反感);3分:中(有点讨厌);4分:良(基本可以接受);5分:优(效果很好) 声音质量的度量 2.5 数字音乐的文件格式 WAV文件 微软公司定义的音频文件格式 基于PCM编码表示一种直接的表达声波的数字形式,用.wav为
您可能关注的文档
- 长春版1年语文(下)生字组词.ppt
- 长春版5年级语文(上)“月光启蒙3”课件.ppt
- 复习课必修一第1单元专题复习(2课时).ppt
- 销售培训_蔡景凌师兄.ppt
- 复习课青岛版三年级上第1单元克、千克和吨的认识.ppt
- 复习青岛版第1单元克、千克和吨的认识.ppt
- 长方体表面积公式计算.ppt
- 长春版5年级(下)“对子歌”.ppt
- 备课_欧洲东部和北亚.ppt
- 复利现值及年金现值的计算.ppt
- (高清版)DB13 5325-2021 生活垃圾焚烧大气污染控制标准.docx
- (高清版)DB13∕T 5348-2021 大丽花脱毒种苗生产技术规程.docx
- (高清版)DB13∕T 5652.7-2023 节水型单位评价导则 第7部分:洗浴场所.docx
- (高清版)DB13∕T 5663-2023 鸟巢蕨设施繁育技术规程.docx
- (高清版)DB13∕T 5706-2023 黄秋葵病虫害综合防控技术规程.docx
- (高清版)DB62∕T 996-2022 绿色食品 双孢蘑菇越冬生产技术规程.docx
- (高清版)DB13∕T 5684-2023 金银花质量调控技术规程.docx
- (高清版)DB13∕T 5699-2023 谷子品种生态适应性评价技术规程.docx
- (高清版)DB13∕T 5341-2021 高水分裹包苜蓿青贮技术规程.docx
- (高清版)DB13∕T 5672-2023 公路路基微型桩加固设计与施工技术规范.docx
最近下载
- 护理不良事件自杀ppt课件.pptx
- 2024年继续教育答案-药学综合知识与技能服务应用.docx VIP
- 2025工会基础知识考试题库(含答案).docx VIP
- 《工会基础知识》考试题库300题(含答案).pdf VIP
- 年产2.5亿袋小柴胡颗粒的车间设计.docx
- 退役军人事务部退役军人培训中心招聘应届毕业生笔试真题2023(含答案).pdf VIP
- 2025年执业药师继续教育2024年执业药师综合知识与技能及服务应用(三)答案.docx VIP
- 2025中考英语作文复习:12个热门写作话题写作指导+满分范文.pdf VIP
- 农村电商直播助力乡村振兴模式研究.docx VIP
- 贵州各地每天日出日落正午时间昼长数据.pdf
文档评论(0)