第1章-音频的基础知识.pptVIP

下载本文档

93
0
约1.94万字
约 77页
2019-04-19 发布于江西
举报
版权申诉

第1章-音频的基础知识.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一、声音信号的基本概念、特点声音按频率分类：声音质量和数据率：声音信号的基本特点声音信号的基本特点声音信号的基本特点二、音频信号的数字处理二、音频信号的数字处理数字音频可分为波形声音、语音和音乐。 4).声音数字化三要素声音的数字化 5).声音数字化计算公式数据量＝采样频率×量化位数×声道数/8(字节/秒) (1) WAV文件（3）WMA文件 WMA(Windows Media Audio)是Windows Media格式中的一个子集(音频格式)。特点：压缩到MP3一半,相同的音质，与其兼容。 MIDI与音乐合成对声音的抽象化(即符号化)表示包括两种类型： MIDI技术利用数字信号处理技术合成的音效有： ①模仿钢琴、小提琴、吉他等音色 ②超越时空的太空音乐。 MIDI标准 MIDI硬件规范：硬件接口标准和信号传输机制(I/O通道类型、连接电缆和插座形式)。 MIDI软件规范：音乐信息数字化编码方式(音符、音符长短、音调和音量等)。 MIDI合成方式调频合成法FM 原理：利用傅立叶级数进行分解。特点：①系统开销小，声音较清脆； ②声音音色少，音质差。 MIDI的工作过程简单的MIDI系统单个物理MIDI通道(MIDI channel)分成16个逻辑通道，每个逻辑通道可指定一种乐器。在MIDI信息(MIDI messages)中，用4个二进制位来表示这16个逻辑通道。音乐键盘可设置在这16个通道之中的任何一个，而MIDI声源或者声音模块可被设置在指定的MIDI通道上接收。复杂的MIDI系统音乐制作系统需3种基本设备音乐制作技术提取原音软件：Exact Audio Copy(EAC) MP3数字CD抓轨把CD音轨转换成WAV格式(无失真)。四、数字音频的压缩标准音频压缩处理流程熵编码参数编码混合编码音频压缩技术标准随着数字移动通信的发展，人们对于低速语音编码有了更迫切的要求。 2.调幅广播质量的音频压缩标准 3. 高保真立体声音频压缩标准编码器的原理编码的过程音频压缩工具五、音频接口及声卡 1．音频卡的功能和分类数字化声音处理混音器合成器音乐合成和MIDI接口规范音乐合成和MIDI接口规范音乐合成和MIDI接口规范音乐合成和MIDI接口规范音箱音箱是一种电声转换的发音设备，它由箱体、扬声器、电源和信号放大器等组成。分类：2.0→双声道立体声 2.1/4.1/5.1/7.1 5.1→五声道＋超重低音声道声卡与音箱杜比环绕立体声技术语音合成 2.5 语音识别技术 1952：Bell实验室研制可识别10个英文数字的语音识别器-Audry系统。 60-80:动态规划(DP)、线性预测(LP)、矢量量化(VQ)、隐马尔可夫模型、人工神经元网络(ANN)。 1988：卡内基-梅隆大学研制SPHINX系统非特定人、大词汇量、连续语音。 1997：IBM公司开发出汉语ViaVoice语音识别系统。ViaVoice98-地方口音语音识别的基本原理根据对说话人依赖程度语音识别软件音乐与语音相比形式更为规范一些。事实上，音乐就是符号化了的声音，这种符号就是乐曲，但音乐不能对所有的声音都进行符号化。接下来，介绍一种符号化的声音媒体----MIDI 它与波形声音相比，MIDI数据不是声音而是指令，所以它的数据量要比波形声音少得多。 1.振幅 A ：它是声波波形的高低幅度，表示声音信号的强弱程度。 2.周期 T ：指两个相邻声波之间的时间长度，即重复出现的时间间隔，以秒(s)为单位。 3.频率 f ：指每秒钟信号变化的次数，即为周期的倒数，以赫（Hz）为单位。 P1 图1-1声波传播状态的信号波形示意图 -------从上面的图可看得出表示声波传播状态的信号波形，图中的正弦波形是与空气的疏密状态相对应的。 ---波峰到波谷之间的纵向距离称为声波的振幅，它反应声音能量的大小，其值与声音的音量成正比，振幅越大，表示音量越大。 ---声音的频率是指每秒钟声波的振动次数，一秒振动一次即为赫兹（Hz）。频率可以和我们日常所说的音调相对应，频率越高，声调越高，声音越尖；反之，频率越低，声调越低，声音越低沉。 1.人说话的声音信号频率通常为300Hz—3k