多媒体技术研究所.pptVIP

下载本文档

7
0
约4.9千字
约 39页
2017-09-11 发布于江苏
举报
版权申诉

多媒体技术研究所.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

多媒体技术研究所第 3 章声音（1）一、声音的数字化 1 什么是声音？ 2 声音的分类（1）按频率划分：次声(Infra-sound) 0-20Hz 可听声 (Audio) 20-20kHz 超声 (Ultrasound) 20kHZ-1GHz 可听声中，声音分为：语音,言语 ( speech ) 300-3400Hz 全频带声音 20-20kHz 音乐 ( music ) 其它声音 (effect sound, noise) 声音的分类（2）数字波形声音语音音乐效果声数字合成声音合成语音 MIDI 3 声音信号的数字化数字波形声音的基本参数 sampling frequency(取样频率) quantization bits(量化位数) number of sound channels(声道数目) encoding method ( compression method )(压缩编码方法) bit rate(码率，比特率)，每秒钟的数据量数字化声音举例 4 数字声音的文件格式 .wav (waveform)，主要用在PC上 .mp3, MPEG Layer III , .rm，.ra(RealAudio), RealNetworks的流式声音文件 .wma，微软公司的流式声音文件 .aif (Audio Interchangeable File Format)，苹果机 .mid .tts 5 声音获取设备麦克风动圈式麦克风Moving-coil MIC (Dynamic) 利用声波推动震膜，震膜带动线圈，利用磁力线的改变产生微弱的电压。例电容式麦克风Condenser MIC 丝带式麦克风RIBBON MIC 压电式麦克风PIEZO-ELECTRONIC MIC 麦克风的指向性(Directional) 指向性是指话筒灵敏度随声波入射方向而变化的特性区分：心型指向指向麦克风超心型指向麦克风全指向麦克风 8字型球指向麦克风声卡 (sound card ) 用途：波形声音的获取、编码；波形声音的重建、播放； MIDI声音的输入； MIDI声音的合成、播放； (CD-ROM 驱动器的控制，CD-DA声音的播放。) 声音卡结构图声卡的性能参数最高取样频率、量化精度；输出功率（1~10W）；是否支持波表合成，波表的容量；芯片类型：Advance Logic，Aureal，ESS… 支持的API：D3D、A3D、EAX… CPU占有率 Money 数码录音笔二、波形声音的编辑 1 常用声音编辑软件 Cool Edit Sound Forge Digital Audio … 2 声音的基本编辑操作声音剪辑音量调节声音反转(Reverse) 时间压缩/拉伸直流噪音消除声音频谱分析 3 声音的效果处理混响/回声/延迟（Reverb/Echo/Delay）和声（合唱）效果（Chorus）动态（压限/门/扩展）效果（Dynamics）升降调（pitch）镶边、颤音、失真等 4 格式转换功能将不同取样频率和量化位数的波形声音进行转换将不同文件格式的波形声音进行相互转换将wav格式声音与MP3声音进行相互转换转换三、数字音频的应用 1、IP电话 2、交互式语音应答系统（自动声讯服务） 3、呼叫中心 4、声音欺骗系统 5、用光盘听书 6、Internet上的实时音频四、语音合成(Speech synthesis) 1 概述语音合成：利用适当的方法和手段，从文本、概念或意向通过合成产生语音的过程。语音合成的3个层次：从文本到语音的合成（Text-to-Speech，简称TTS）；从概念到语音的合成（Concept-to-Speech）；从意向到语音的合成（Intention-to-Speech）。文语转换的要求对合成语音的要求：可理解自然低延迟语速可变声音可变语言可变应用：声讯服务，自动应答, 有声电子邮件, 残疾人服务, 自动配音等. 语音基础知识音素(phoneme)是语音的最小单位。音素分为：元音(vowel)（浊音），不受声道阻碍的音。辅音(consonant)（浊音或清音），受声道阻碍的音。英语语音每字(词)一个或几个音节(syllable)（多音节字）音节由一个或几个音素组成英语的音素：元音20个辅音28个汉语语音每字一个音节(syllable)（单音节字）音节由一个或几个音素