计算机绘图及多媒体6.2-6.3.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6.2 音频 计算机中创建音频时,所能模拟的声音还必须要符合人类的听觉特征和听力范围。 目前的数字音频主要分为: 声波、语音和音乐三类。 6.2.1 声波技术基础 声音是纵波,如图6-2-1所示。 决定声波的物理特性有振幅、频率和相位。 声波的物理特征 声音的强度 国际标准的参照声:在1kHz频率的正弦波中,能被人耳察觉的最弱声压大约是2.83Х10-4dyn/cm2。 声波的频率 指物体每秒钟振动的次数。 一般人的听力范围是 20Hz~20kHz。这个频率区域称为可闻声段,大致可分为低频、中频和高频。 相位 指波形的变化方向,如果是多个波形组合,起始相位可以相同或不同。 声波的物理特征 在某一个瞬时T,不同波形的相位都可以是不同的 声音的数字原理 模拟声音的信号是个连续量,可能由许多具有不同振幅和频率的正弦波组成。必须将模拟声音数字化后才能在计算机中进行处理。 声音的模/数转换(ADC),就是将模拟的声音信号转化成计算机能识别的数字信号。 声音的数/模转换(DAC),即由数字声音变成模拟的波形。 声音的数字化过程 量化-将模拟信号的采样值用数字方法读出 量化过程--将采样后的信号按整个声波的幅度划分为若干个区段,把落入某区段的样值归为一类,并赋予相同的量化值。 编码 编码是按一定的格式将离散的数字信号记录下来。 并在数据的前、后加上同步、纠错等控制信号。 音频编码有许多标准,分别用于不同的应用环境。 数字声音质量的主要因素 声音的采样速率 即采样频率,单位为Hz(赫兹)。 流行的采样频率主要为: 22.05KHz、44.1KHz、48KHz 采样速率越高,采样周期越短,单位时间内得到的数据越多,对声音的表示越精确,音质越真实。 但是高采样率的数据将占有很大的空间。 数字声音质量的主要因素 声音可以有多个通道个数 声音的采样还与声道数有关: 单声道只有一个数据流, 立体声的数据流至少在两个以上。 立体声在时间和空间上都能显示更好的效果,但相应数据量将成倍增加。 数字声音质量的主要因素 采样数据量 采样数据的存储容量计算公式如下: 存储容量(字节)=采样频率×采样精度/8×声道数×时间 为了减少数据量,采样且量化后的数据常要进行压缩。 与采样的数字声音质量有关的参数: 采样精度: 即采样位数或采样分辨率,表示采样点的等级数。 常用的采样精度分别是8位、16位和32位。 用8位二进制描述采样点的幅值可以有256个等级, 若用16位二进制分割,则分为65536个区。 采样位数越多,可分出的幅度级别越多,则分辨率越高,失真度越小,录制和回放的声音就越真实。但是位数越多,声音质量越高,所占空间就越大。 国际标准的语音采用8位二进制位编码。 6.2.2 常用的声波编辑方法 Cool Edit Pro 2.1软件的功能特点 高精度多链接。 提供32-bit 音频处理精度,支持 24bit/192kHz 以及更高的精度。 支持 SMPTE/MTC Master、视频、CD、MIDI、等设备。 两种编辑模式。 单轨模式可以对一个音频文件或者部分音节进行编辑。 多轨模式允许同时打开多个音频文件,支持轨数最多为128轨。 强大的音频编辑功能。 支持可选的插件、崩溃恢复、自动静音检测和删除、自动节拍查找、录制等。可以创建音调、歌曲、声音、弦乐、颤音、噪音。 丰富的特效功能。 提供实时效果器、实时均衡处理器。提供超过 40 种音频效果器,使作品增色:放大、降低噪音、压缩、扩展、回声、失真、延迟等。 支持多音频文件格式和格式转换。 Cool Edit Pro 2.1的界面 Cool Edit的编辑一般过程 创建新文件,录制声音或从CD、视频文件中导入音频。或打开已有的音频文件。 设置音频文件必要的参数。 对需要处理的各个音频文件进行单轨编辑和效果处理。 在多轨模式下,对多个音轨进行剪切、粘贴、合并、重叠声音等编辑。 保存或输入所编辑的音频文件。 6.2.3 语音技术 语音是音素、音位到句子音段、轻重音到语调等语音手段的统称。 语音以语言系统有声单位的形式出现 具有语言学区别功能。 计算机对语音的处理主要包括: 对语音的采样、识别、模拟和合成。 数字语音也是通过对模拟语音采样、A/D转换、并按一定的方式进行编码而形成,可以用波形文件保存。 语音识别技术 语音自动识别的最终目标是要将连贯的语音机械地变换成文字符号系。 目前,语音的自动识别基本上采用: 孤立词的模式匹配识别 有限词汇的连续识别。 孤立词的模式是一种认人的识别方式。 实验结果表示,一般识别率都在95%以上。 孤立词的模式识别系统的原理如图6-2-7所示。 连续语音识别原理 语音合成-两种实现途径 可通过再生预存的语音信号 再生预存的语音信号方式,是采用了数字存储技术,预先存入的语音信号,

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档