IIS音频总线学习(一)数字音频技术.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
IIS音频总线学习(一)数字音频技术.doc

IIS音频总线学习(一)数字音频技术 IIS音频总线学习(一)数字音频技术一、声音的基本概念? ? 声音是通过一定介质传播的连续的波。 图1 声波重要指标: 振幅:音量的大小 周期:重复出现的时间间隔 频率:指信号每秒钟变化的次数 声音按频率分类: 图2 声音的频率(语音信号频率范围:300Hz-3kHz)声音的传播携带了信息,它是人类传播信息的一种主要媒体。?声音的三种类型: 波形声音:包含了所有声音形式 语音:不仅是波形声音,而且还有丰富的语言内涵(抽象→提取特征→意义理解) ?音乐:与语音相比,形式更规范。音乐是符号化的声音。 二、声音的数字化1.声音信号的类型 模拟信号(自然界、物理) 数字信号(计算机) 2.声音数字化过程 图3?声音数字化过程3.声音数字化过程示意图 图4?声音数字化过程示意图4.声音数字化三要素 采样频率 量化位数 声道数 每秒钟抽取声波幅度样本的次数 每个采样点用多少二进制位表示数据范围 使用声音通道的个数 采样频率越高 声音质量越好 数据量也越大 量化位数越多 音质越好 数据量也越大 立体声比单声道的表现力丰富,但数据量翻倍 11.025kHz 22.05 kHz 44.1? kHz 8位=256 16位=65536 单声道 立体声 5.声音数字化的数据量音频数据量=采样频率×量化位数×声道数/8(字节/秒) 采样频率 (kHz) 量化位数 (bit) 数据量(KB/s) 单声道 立体声 11.025 8 10.77 21.35 16 21.53 43.07 22.05 8 21.53 43.07 16 43.07 86.13 44.1 8 43.07 86.13 16 86.13 172.27 三、音频的文件格式1.WAV文件WAV是Microsoft/IBM共同开发的PC波形文件。因未经压缩,文件数据量很大。 特点:声音层次丰富,还原音质好 2.MP3文件MP3(MPEG Audio layer3)是一种按MPEG标准的音频压缩技术制作的音频文件。 特点:高压缩比(11:1),优美音质 3.WMA文件WMA(Windows Media Audio)是Windows Media格式中的一个子集(音频格式)。 特点:压缩到MP3一半 4.MIDI文件MIDI(乐器数字接口)是由一组声音或乐器符号的集合。 特点:数据量很小,缺乏重现自然音 四、数字音频压缩标准1.音频压缩方法概述 图5?压缩编码技术是指用某种方法使数字化信息的编码率降低的技术 音频信号能压缩的基本依据:①声音信号中存在大量的冗余度; ②人的听觉具有强音能抑制同时存在的弱音现象。 音频信号压缩编码的分类:①无损压缩(熵编码) 霍夫曼编码、算术编码、行程编码 ②有损压缩 波形编码--PCM、DPCM、ADPCM 、子带编码、矢量量化 参数编码--LPC 混合编码--MPLPC、CELP 2.音频压缩技术标准 分类 标准 说明 电话语 音质量 G.711 采样8kHz,量化8bit,码率64kbps G.721 采用ADPCM编码,码率32kbps G.723 采用ADPCM有损压缩,码率24kbps G.728 采用LD-CELP压缩技术,码率16kbps 调幅广 播质量 G.722 采样16kHz,量化14bit,码率224(64)kbps 高保真 立体声 MPEG 音频 采样44.1kHz,量化16bit,码率705kbps (MPEG三个压缩层次,384-64kbps) 五、声卡1.声卡的主要功能声卡是负责录音、播音和声音合成的一种多媒体板卡。其功能包括: ①录制、编辑和回放数字音频文件 ②控制和混合各声源的音量 ③记录和回放时进行压缩和解压缩 ④语音合成技术(朗读文本) ⑤具有MIDI接口(乐器数字接口) 2.芯片类型 CODEC芯片(依赖CPU,价格便宜) 数字信号处理器DSP(不依赖CPU) 转自:/ce123/article/details/6919862

文档评论(0)

dmz158 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档