- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.数字音视频基础 1.1声波的基本特性 声波和声音 一定频率的机械振动在弹性媒质中的传播就形成声音,这种机械波就称为声波 声源 形成声波的振动源称为声源 媒质 能够传递声波的弹性物质,气体、液体或固体都可以是传播声音的媒质 声波的波长、频率和声速 声波的反射、衍射和干涉 声音的三个要素 音调 音调的高低取决于振动的频率,频率高的声波音调高 人耳能感觉到的频率为20Hz~20kHz 频率高于20kHz的声波称为超声波 频率低于20Hz的声波称为次声波 声强或响度: 声强是指声波的强度(单位时间内传过单位横截面积声波的能量) 声音的强度取决于声波振幅的大小(正比于振幅的平方) 响度是人耳对声音强弱的主观感受,它取决于声强,也与频率有关 技术上,声强用分贝(db)量度 音色 不同的声源发出同一音调的声音时,声音的品质不同 这是由于两列声波的频率相同,但波形不同,从而音色就不同 最单纯的声音的波形是正弦波 复杂声音可看作一个基音和若干频率是基音频率整数倍的泛音迭加而成 基音的频率决定音调,泛音的构成(频谱)决定音色 声音的数字化 声音的波形是连续的,通过话筒,把声音(声压)转化为电压,所得到的表示声音的电压波形也是连续的(模拟信号) 通过专用设备,以一定的频率来采集波形的电压数值,就可以把声音数字化。 声音数字化的几个技术指标 采样频率 11.025kHz(电话质量) 22.05kHz(收音机质量) 44.1kHz(CD质量) 采样位数 8bits、16bits、32 bits等 声道数 单声道、双声道、环绕立体声 声音文件的数字格式 未经压缩的声音文件数据量很大 数据量=采样频率×采样位数×声道数×时间(秒) ÷8 (1分钟音乐数据约10MB) 常见声音的格式 1、wav格式:(波形格式文件,无损) 由microsoft和IBM开发,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相差无几。作为数字音乐文件格式的标准,采用PCM无损编码,WAV 格式容量过大,但支持度广泛。 声音文件的格式 2、APE:(无损压缩) APE是流行的数字音乐文件格式之一。与MP3这类有损压缩方式不同,APE是一种无损压缩音频技术,也就是说从音频CD上读取的音频数据文件压缩成APE格式后,再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。APE的文件大小大概为CD的一半,APE可以节约大量的资源 。 压缩工具:Monkeys Audio 声音文件的格式 3、FLAC :(无损压缩) FLAC即是Free Lossless Audio Codec的缩写 。中文可解释为无损音频压缩编码。 flac的文件大小与APE差别不大,大概为CD的一半。单从技术角度讲稍好与APE,FLAC开源,跨平台,支持的硬件多。 (无损格式:WAV 、APE、 FLAC) 声音文件的格式 4、mp3 :(有损压缩) MPEG Audio Layer 3,简称为MP3 。 将音乐以1:10 甚至 1:12 的压缩率,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节 。 特点:它丢弃掉音频数据中对人类听觉不重要的数据 ,保留人耳敏感的数据(2-5K),属于有损压缩。支持可变速率,使用广泛。 声音文件的格式 5、WMA :(有损压缩) WMA的全称是Windows Media Audio缩写 。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18,生成的文件大小只有相应MP3文件的一半 。加入防拷贝防盗版等措施。 特点:1、低码率下音质较好,高码率音质损失较严重; 2、非常适用于网络流媒体; (最新的Codec为Windows Media Audio 10 professional ) 声音文件的格式 6、OGG格式 : Ogg全称应该是OGG Vobis(ogg Vorbis) 是一种新的音频压缩格式,类似于MP3等的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。OGG Vobis有一个特点是支持多声道 。同样位速率(Bit Rate)编码的OGG与MP3相比听起来更好一些 。 特点:1、新技术、不断改良完善,支持HTML5; 2、支持多声道 3、音质表现好(相对MP3等)
文档评论(0)