多媒体应用系统技术.pptVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒体应用系统技术.ppt

多媒体应用系统技术 第五章:音频素材制作与处理 5.1 模拟音频 模拟信号、数字信号 时间和幅度上都是连 续的信号称为模拟信 号。 5.1 模拟音频 声音 声源:正在发声的物体 产生:声音是由物体振动产生的声波 声波:是随时间连续变化的物理量, 是连续的模拟信号,可以用振幅、周期、频率描述 5.1 模拟音频 振幅:声音波形振动的幅度,表示声音的强弱,即音量(分贝dB) 周期:声音波形完成一次全振动经过的时间 频率:声音波形在一秒钟内完成全振动的次数(赫兹HZ) 亚音信号:频率20hz 超音频信号:频率20000 音频信号:介于中间的信号 5.1 模拟音频 声音三要素 音强:声音的强弱,即音量,与声波振幅成正比 音调:声音的高低,与频率有关 音色:声音的特色。分纯音和复音(不同频率、不同振幅) 5.1 模拟音频 模拟音频的处理 被转换成电信号,由模拟元部件处理。 模拟音频的特点 频率范围 连续性 音质(与频率范围、设备、噪音等因素有关) 5.2 数字音频 数字音频 以二进制的方式记录的音频,是模拟音频的数字化表达。 实现:声卡 (采样、量化、编码) 比较 常用格式:wav(微软),midi(乐器数字接口),cda(cd音乐),mp3,wma(微软,网络音频格式),ra/rm(real networks) 5.3 语音合成技术 语音合成 是指利用计算机合成语音的一种技术,使计算机能够产生高清晰度、高自然度的连续语音,具有类似于人一样的说话的能力 三个层次 文字到语音、 概念到语音、 意向到语音 文语转换实现 5.3 语音合成技术 文语转换过程 (1)文本分析器根据发音字典,将文本字符串分解为带有属性标记的词和读音符号 (2)韵律分析:再根据语义规则和语音规则,为每一个词、每一个音节确定重音等级和语句结构及语调,以及各种停顿等。 (3)语音合成 波形编辑合成 参数合成分析 规则合成 语音合成特点 自然度 清晰度 表现力 复杂度 5.4 语音识别技术 语音识别 计算机通过识别和理解过程把语音信号转变为相应的文本或命令的技术。即让计算机能够听懂人类的语言。 例如:IBM的语音识别软件ViaVoice,可以帮助人们通过话筒用语音向字处理软件输入文字 关键技术:特征提取技术、模式匹配技术、模型训练技术 LOGO 计算机科学与技术学院 模拟音频、数字音频 1 语音合成技术 2 语音识别技术 3 幅度是离散的信号称数字信号。 声源振动,通过空气等介质,把这种振动以机械波的形式传播,这就是声波。声波传入人的耳朵,促使耳膜产生振动,这种耳膜振动被传导到人的听觉神经,就产生了对“声音”的感觉 人耳听不见 压缩率高 压缩率有限 压缩 容易 不易 编辑 光盘、硬盘 磁带、唱片 存储 数字信号 模拟信号 文本分析器 韵律分析模块 语音生成模块

文档评论(0)

000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档