- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
7.1 声音的获取与播放 多媒体技术处理的声音信号主要是人耳可听到的20~20kHz的音频信号(audio) 言语(speech)/语音:人说话的声音,其频率范围约为300~3400Hz 全频带声音:音乐声、风雨声、汽车声等其他声音,其带宽可达到20~20kHz 7.1.2 声音信号的数字化 声音信号的数字化:将模拟声音信号转换成数字编码形式以便于计算机进行处理的过程 声音信号数字化的过程: 取样:输入模拟声音,按固定时间间隔截取该信号的振幅值,每个波形周期内截取2次,该振幅值用若干二进制数表示。 量化:量化精度为8位、12位、16位,位数高,声音保真度好 编码:数据压缩,减少数据量 模拟的声音信号转变成数字形式进行处理的优点: 以数字形式存储的声音重放性能好,复制时没有失真 数字声音的可编辑性强,易于进行效果处理 数字声音能进行数据压缩,传输时抗干扰能力强 数字声音容易与其他媒体相互结合(集成) 7.1.3 声音的获取设备 麦克风:将声波转换为电信号 声卡(sound card):进行数字化 声音的获取:把模拟的声音信号转换为数字形式。(话筒或线路输入、单双道) 声音的重建与播放 MIDI(Musical Instrument Digital Interface)声音的输入 MIDI声音的合成与播放 声卡的工作原理 PC机的声卡较多的已经与主板集成在一起,不再做成独立的插卡。 利用声卡可在线(on-line)获取声音;使用数码录音 笔可离线(off-line)获取声音,然后再通过USB接 口直接将已经数字化的声音数据送入计算机中。数 码录音笔的原理与声卡基本相同,不过由于带宽的 原因,它一般适合于录制语音。 7.1.4 声音的播放 声音播放:计算机输出声音的过程,分为2步: - 把声音从数字形式转换成模拟信号形式 - 将模拟声音信号经过处理和放大送到扬声器发出声音 声音重建步骤: 声音重建(reconstruction):声音信号数字化的逆过程 解码:把压缩编码的数字声音恢复为压缩编码前的状态 数模转换:把声音样本从数字量转换为模拟量 插值处理:把时间上离散的一组样本转换成时间上连续的模拟声音信号 声音的重建也是由声卡完成的。声卡输出的声音需送到音箱去发音。 音箱分类 普通音箱:接收的是重建的模拟声音信号 数字音箱:可直接接收声卡输出的数字声音信号,避免信号在传输中发生畸变和受到干扰,其音响效果更加突出 7.2 声音的表示与压缩编码 7.2.1 波形声音的主要参数 取样频率 量化位数 声道数目:一次采样的声音波形个数 使用的压缩编码方法 比特率(bit rate):指的是每秒钟的数据量,也称码率 数字声音未压缩前,其计算公式为: 波形声音的码率 = 取样频率 × 量化位数 × 声道数 压缩编码以后的码率 = 压缩前的码率 / 压缩倍数 几种常见数字声音的主要参数 7.2.2 全频带声音的压缩编码 问题:数据量很大。如CD盘片上所存储的立体声高保真的全频带数字音乐,1小时的数据量大约是635MB 目的与办法:降低存储成本和传输通信带宽,对数字波形声音进行数据压缩 波形声音数据压缩的可能性:声音信号中包含有大量的冗余信息,再加上还可以利用人的听觉感知特性,因此,产生了许多压缩算法 声音数据压缩算法的评价:压缩倍数高,声音失真小,算法简单,编码器/解码器的成本低 全频带声音的压缩编码 第1代编码技术——PCM(脉冲编码调制)编码:依据声音波形本身的信息相关性进行数据压缩,代表性的应用是CD唱片 第2代压缩编码——感知声音编码(perceptual audio coding) :不但充分利用声音信息本身的相关性,而且还充分利用人耳的听觉特性,即使用“心理声学模型”来达到大幅度压缩数据的目的 第2代压缩编码——感知声音编码的编码过程: 第1阶段:通过时间/频率变换和心理声学分析,揭示原始声音中与人耳感知无关的信息 第2阶段:通过量化和编码予以抑制 第3阶段:使用熵编码消除声音信息中的统计冗余 第2代全频带声音压缩编码标准 MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次: 层1(Layer 1):编码简单,用于数字盒式录音磁带 层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等 层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐,压缩10倍 MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声 杜比数字AC-3(Dolby Digital AC-3):美国杜比公司开发的多声道全频带声音编码系统。 它提供的环绕立体声系统由5个全频带
文档评论(0)