第2章多媒体音频技术课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章多媒体音频技术课件

* 2.4.7 (Flanger飘浮效果) 3.Flanger飘浮效果 Flanger就是把原声经过频率调制后稍微延时。Transform/Delay Effects/Flanger菜单 Flanger对话框的主要参数 Original 最初效果 Delayed 延时效果 Initial Mix Delay 最初效果与延时效果合并 Final Mix Delay 最后效果与延时效果合并 Stereo Phasing 立体声相位 Feedback 反馈 * 本章小结 本章介绍了声音数字化的概念和音频压缩的国际标准,简述了声卡的工作原理和性能指标,并介绍了MIDI音乐和语音识别技术。 * 次声波又称亚声波,它是一种频率低于人的可听声波频率范围的声波。次声波的频率范围大致为4Hz~20Hz。   次声波产生的声源是相当广泛的,现在人们已经知道的次声源有:火山爆发、极光、地震、海啸、台风、龙卷风、电离层扰动等等。利用人工的方法也能产生次声波,例如核爆炸、火箭发射、化学爆炸,等等。   由于次声波的频率很低,所以在传播过程中大气对它的吸收系数很小。由于次声波不容易被吸收,所以它的传播距离就很远。1883年8月27日印度尼西亚的喀拉喀托火山爆发时,它所产生的次声波围绕地球转了三圈,传播了十几万千米。当时,人们利用简单的微气压计曾记录到它。次声波不但“跑”得远,而且它的速度大于风暴传播的速度,所以它就成了海洋风暴来临的前奏曲,人们可以利用次声波来预报风暴的来临。 * 超声波有两个特点,一个是能量大,一个是沿直线传播。它的应用就是按照这两个特点展开的。 如果把超声波通入水罐中,剧烈的振动会使罐中的水破碎成许多小雾滴,再用小风扇把雾滴吹入室内,就可以增加室内空气的湿度。这就是超声波加湿器的原理。对于咽喉炎、气管炎等疾病,药力很难达到患病的部位。利用加湿器的原理,把药液雾化,让病人吸入,能够增进疗效。 超声波基本上是沿直线传播的,可以定向发射。如果渔船载有水下超声波发生器,它旋转着向各个方向发射超声波,超声波遇到鱼群会反射回来,渔船探测到反射波就知道鱼群的位置。这种仪器叫做声呐。人体各个内脏的表面对超声波的反射能力是不同的,健康内脏和病变内脏的反射能力也不一样。平常说的“B超”就是根据内脏反射的超声波进行造影,帮助医生分析体内的病变。医生向人体内发射频率已知的超声波,超声波被血管中的血流反射后又被仪器接收,测出反射波的频率变化,就能知道血流的速度。这种方法俗称“彩超”,可以检查心脏、大脑和眼底血管的病变。 * 参见书3.1.1 * 通常4.1声道有5个发音点:前左、前右、后左、后右,听者被包围在中间,同时还附加一个超重低音音箱,以加强对低频信号的回放处理。5.1声道环绕立体声是以4.1声道环绕立体声为基础,以杜比AC-3、DTS等声音录制压缩格式为技术蓝本的新型声场环绕系统。相对于4.1环绕来说,它的不同之处在于增加了一个中置单元,用于在观看影片时,将对话集中在整个声场的中部,加强电影中对白的表现效果,以增加整体的影院效果。7.1系统是在5.1的基础上增加了中左和中右两个发音点,以求达到更加完美的境界。 * 通常4.1声道有5个发音点:前左、前右、后左、后右,听者被包围在中间,同时还附加一个超重低音音箱,以加强对低频信号的回放处理。5.1声道环绕立体声是以4.1声道环绕立体声为基础,以杜比AC-3、DTS等声音录制压缩格式为技术蓝本的新型声场环绕系统。相对于4.1环绕来说,它的不同之处在于增加了一个中置单元,用于在观看影片时,将对话集中在整个声场的中部,加强电影中对白的表现效果,以增加整体的影院效果。7.1系统是在5.1的基础上增加了中左和中右两个发音点,以求达到更加完美的境界。 * 灵敏度差3dB,输出声压差一倍 * 2 语音识别的基本原理 训练在识别之前进行,通过让讲话者多次重复语音,从原始语音样本中去除冗余信息,保留关键数据,再按照一定规则对数据加以聚类,形成模式库。 识别结果 预处理 训练 模式库 模式匹配 特征提取 语音输入 * 2 语音识别的基本原理 模式匹配部分是整个语音识别系统的核心,它是根据一定的准则(如某种距离测度)以及专家知识(如构词规则、语法规则、语义规则等),计算输入特征与库存模式之间的相似度(如匹配距离、似然概率),判断出输入语音的语意信息。 识别结果 预处理 训练 模式库 模式匹配 特征提取 语音输入 * 2.根据对说话人依赖程度 特定人语音识别系统:专人 非特定人语音识别系统:所有人 限定人识别系统:一组人 孤立词语音识别系统:每词后停顿 连接词语音识别系统:连音 连续语音识别系统:连音、变音 3.根据对说话人说话方式 1.根据

文档评论(0)

zsmfjh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档