2013多媒体技术2xs.pptVIP

下载本文档

16
0
约1.21万字
约 62页
2016-11-28 发布于广东
举报
版权申诉

2013多媒体技术2xs.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

* * 注意，消除噪声对原声会有不同程度的损耗，所以要多听多试，选择合适的方案，既去除了不可忍受的背景噪声，而声音也没有过分变形。 * 我们知道，每一种我们听得见、听不见的声音，都有它的振动频率，频率越低，音调越低，频率越高，音调越高，如低音类乐器（大提琴、BASS等）的主体频率一般在30Hz～300Hz之间，人声的主体频率在60Hz～2000Hz之间等。很多时候，我们需要做必要的均衡处理，比如，为了突出小提琴音色的亮丽，需要提升它的高频区；而BASS、低音鼓则需要适当提升低频，衰减高频。尤其在声部（乐器）众多的时候，均衡就更为重要，它可以使整个作品各声部层次分明，清晰而不混浊。 * 制作伴奏带 * * 　 The End！ * * * * * * * * * * * * * * * * * * * * * * * * * * * Cool Edit Pro可以录入多种音源，如：话筒、录音机、CD播放机等，将这些设备与声卡连接好，就可以准备录音了。录音的步骤如下：在录音之前还需调整“声音与音频属性”，需要把录音项打勾，在MIC一栏中选中，其它的不要选择，因为我们要录的只是自己要歌唱的声音。 * 一个CD音频文件是一个＊.cda文件，这只是一个索引信息（快捷方式），并不是真正的包含声音信息，所以不论CD音乐的长短，在电脑上看到的“＊.cda文件”都是44字节长。注意：不能直接的复制CD格式的＊.cda文件到硬盘上播放，需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WAV，这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话，可以说是基本上无损抓音频。推荐大家使用这种方法。 * 在波形窗口左右声道的交界处拖动鼠标，选中要处理的波形区域，单击右键弹出快捷菜单就可以选择剪切或复制命令，在需要插入波形的地方同样单击右键弹出快捷菜单就可以选择粘贴命令。 * Cool Edit Pro可以在保证不出现声音失真的前提下，对声音进行调整。 * 淡入效果是指音频选区的起始音量很小甚至无声，而最终音量相对效大。淡出效果是指音频选区的起始音量相对较大，而最终音量很小甚至无声。五、MIDI音乐制作系统输入设备：电子琴(MIDI In,MIDI Out) MIDI键盘 Cakewalk虚拟键盘音序器：硬件音序器、软件音序器音源：声卡(模拟乐器发声的设备) 2.3 MIDI与音乐合成一、语音识别的发展历史 1952：Bell实验室研制可识别十个英文数字的语音识别器-Audry系统。 60-80:动态规划(DP)、线性预测(LP)、矢量量化(VQ)、隐马尔可夫模型（HMM）、人工神经元网络(ANN) 特定人、孤立词、小词汇量语音识别系统。 1988：卡内基-梅隆大学研制SPHINX系统非特定人、大词汇量、连续语音。 1997：IBM公司开发出汉语ViaVoice语音识别系统。ViaVoice98-地方口音语音识别技术就是让机器通过识别和理解，把语音信号转变为相应的文本或命令的高技术。 2.4 语音识别技术语音识别分为训练和识别两个阶段。训练阶段是在机器中建立被识别语音的样板或模式库，或者对已存在机器中的样板或模式做特定发音人的适用性修整。在识别阶段，将被识别的语音特征参量提取出来进行模式匹配，相似度最大者即为被识别语音。二、语音识别的基本原理预处理部分包括语音信号采样，反混叠带通滤波，去除个体发音差异和设备、环境引起的噪声影响等，并涉及语音识别基元的选取和端点检测问题。特征提取部分用于提取语音中反映本质特征的声学参数，如平均能量、平均跨零率、共振峰等。训练在识别之前进行，通过让讲话者多次重复语音，从原始语音样本中去除冗余信息，保留关键数据，再按照一定规则对数据加以聚类，形成模式库。模式匹配部分是整个语音识别系统的核心，它是根据一定的准则以及专家知识，计算输入特征与库存模式之间的相似度，判断出输入语音的语义信息。 2.4 语音识别技术三、语音识别系统的分类 1.按照说话的方式孤立词识别连接词识别连续语言识别与理解 2.按照说话者与识别系统的相关性特定人识别（专人）限定人识别（一组人）非特定人识别（所有人） 3.按照识别词汇量多少小词汇量（100个词以下）中词汇量（100～1000个词）大词汇量（1000个词以上）语音识别研究的最终目标是要实现大词汇量、非特定人、连续语音的识别。 2.4 语音识别技术四、语音识别软件ViaVoice 目前汉字输入的方式主要有四种：键盘输入，手写输入，扫描输入和语音输入。键盘输入：键盘输入基本上是基于各种输入法，主要又分为字形