第5章多媒体音频技术案例.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5.5 语音识别技术及应用 5.5.1 语音识别的基本原理及过程 5.5 语音识别技术及应用 5.5.2 文本—语音转换技术 5.5.3 语音识别软件(ViaVoice) 目录 * 第五章 多媒体音频技术 第5章 多媒体音频技术 音频概述 声音的数字化 Audition音频处理软件 MIDI与音乐合成 语音识别技术及应用 5.1 音频基础 5.1.1 声音的基本概念 声音在物理学上称之为声波,是通过一定介质(如空气、水等)传播的连续的振动的波。 声波引起某处媒质压强的变化量称为该处的声压。 声音的强弱体现在声波的振幅上 音调的高低体现在声波的周期和频率上。 5.1.1 声音的基本概念 声波是随时间连续变化的物理量,它有3个重要指标: 振幅——波的高低幅度,表示声音的强弱; 周期——两个相邻波之间的时间长度; 频率——每秒振动的次数,以Hz为单位。 振 幅 周 期 基 线 1.声音如何传播 声音依靠介质的振动进行传播。 声源实际上是一个振动源,它使周围的介质(空气、液体、固体)产生振动,并以波的形式进行传播。 声源的形式多样,例如,吉他、人的声带、农村的拖拉机等。 声源振动,通过它周围的空气、水等传播介质进行传播,形成“声波”。 人耳接收到声波,耳膜随之振动,再通过听觉神经末梢的传递,就可以听见声音。 2.声音的频率 声源每秒振动的次数称为该声源的“频率”。 用音频来表示声音信号的频率,单位为赫兹(Hz)。 频率对于声音来说是个非常重要的概念,不同的声音有不同的频率范围,人耳只能听到频率范围在20Hz~20kHz之间的声音,低于20Hz的次声和高于20kHz的超声都听不到。 次声波 可听声波 超声波 20Hz 20kHz f(Hz) 人耳对不同频率的敏感程度有很大差别 对中频段(2 kHz~4 kHz)最为敏感,幅度很低的信号都能被人耳听到; 对低频区和高频区较不敏感,能被人耳听到的信号幅度比中频段要高得多。 10 20 50 200 3.4k 7k 15k 20k CD-DA FM广播 AM广播 电话 f(Hz) 3.声音的传播方向 当辐射出来的声波波长比声源的尺寸大时,声波比较均匀地向各方向传播; 当辐射出来的声波波长小于声源的尺寸时,声波集中地向正前方一个尖锐的圆锥体范围内传播。 4.声音的三要素 声音效果的三要素:音调、音强、音色。 音调:指声音的高低。音调的高低,主要取决于声波频率的高低。频率越高,音调越高,反之亦然。 在使用音频处理软件对声音的频率进行调整时,其音调也会随之产生变化。例如,男子发音,其频率约在90~140Hz之间,其音调较低;女子发音的频率约在270~550Hz之间,其音调较高。 音强:是指声音的强度,又称声音的响度,由声波振动的振幅决定。它是人耳感受到的声音强弱,是人对声音大小的一个主观感觉量。 音色:即声音的品质,它由泛音的多少、泛音的频率和振幅决定。例如,不同的乐器在基本振动频率相同的情况下,仍然可以区分各自的特色,就是因为它的音色不同。 5.音质 “音质”是声音的质量,音质的好坏与音色的频率范围有关。 影响音质的因素 对于数字音频信号,音质的好坏与数据采样频率和数据位数有关。 音质与声音还原设备有关。 音质与信号噪声比有关。 5.1.2 音频素材的获取 自行录制 Windows自带的录音机 (Sound Recorder) 从素材库或网站中获取 从CD、VCD等媒体中获取 目录 5.2 声音的数字化 采样频率 在某个特定的时刻对模拟信号进行测量叫做采样。采样频率也称取样频率,是指在单位时间(1s)内采样的次数。 采样 量化 声音的模拟信号 声音的数字信号 编码 5.1.2 数字化过程 5.2 声音的数字化 量化位数 量化是将经过采样得到的离散数据转换成二进制数的过程。量化位数,即分辨率,是指将经过采样得到的离散数据转换成二进制数的位数,一般为32、16、8、4位。 声道数 声音通道的个数称为声道数,是指一次采样所记录产生的声音波形个数。声道有单声道和立体声之分。 5.2.2 数字音频压缩标准 1 音频压缩方法概述 音频压缩方法是指对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或者所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。逆变换的过程,称为解压缩或解码。 输入音频信号 输出音频信号 编码器 传输/存储 解码器 5.2.2 数字音频压缩标准 2.音频压缩技术标准 目录 .rm ● RA(RealAudio) Real音频文件 主要适用于在网络上的在线音乐欣赏

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档