- 1、本文档共66页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
声音数字化技术
第二章声音数字化技术; 2.1 声音信号 一、基本概念; 一、基本概念; 1.频率与音调;幅度:最高点与基线的距离 ;音色:声音的特色。 ;距离方向:声音传播的时间差。
附加信息:空间信息。;一、基本概念;二、声音信号数字化--;(2) 量化;二、声音信号数字化;(1) 采样频率;(2) 量化精度;(3) 声道数;质量;2.2 声音编码;2.2 声音编码;二、脉冲编码调制(PCM);二、脉冲编码调制(PCM);① 均匀量化:采用相等的量化间隔;
② 非均匀量化:依据信号的大小采用不同的量化间隔 ,如幂律、A律压扩。; 根据输入信号幅度大小来改变量化间隔大小。这种自适应可以是瞬时自适应,即量化间隔的大小每隔几个样本就改变,也可以是音节自适应,即量化间隔的大小在较长时间周期里发生变化。
改变量化间隔大小的方法有两种:一种称为前向自适应,另一种称为后向自适应。;信道;APCM 后向自适应 ; 记录与预测值的差距。;DPCM编码:0,3,1,0,-1,-1,-2,-1。每个信号值用3位表示。与PCM编码相比,数据压缩率为3/8=37.5%。 ;DPCM编码:;DPCM编码:0,2,2,2,-1,-1,-2,-1; APCM+DPCM;只记录增减标志,增/减量(量化阶)预先设定;
时刻
;
时刻
;
时刻
; 增量随声音信号的变化进行自动调整。如:同样符号的幅值连续两次以上,将幅值调整为原来的两倍。幅值变号时可以调整为原来的1/2。对上述的PCM编码进行ADM调制,增量初值设置为2。 ;ADM编码: ;ADM编码:1, 0, 1, 1 , 1, 0,0,0。存储1ms的声音使用了8位,合1个字节。与PCM编码相比,数据压缩率为1/8=12.5%。 ; 子带:把输入声音信号的频带分成若干个连续的频段,每个频段称为子带。; 根据听觉特性来开发的感知编码系统,它将每一声道的音频根据人耳听觉特性区分为许多频段(通常为六个),然后对不同的频段采用不同的编码策略。在编码过程中再根据音响心理学的原理进行分析,保留有效的声音,删除多做的信号和各种噪声频率,使重现的声音更加纯净,分离度极高。六个声道的信息在制作和还原过程中全部数字化,信息损失得很少。全频段的细节十分丰富,具有真正的立体声。 ;; MP3音频标准是一个适用范围较广的音频压缩标准,它对音频源没有要求。它利用人耳听觉系统的感知特性,压缩率的取得来自去掉人耳听不到的信息细节。虽然压缩是有失真的,但对人耳来说这些失真是听不到的。也即对人耳而言,MP3音频压缩是不失真的。
上述感知特性指的是人耳听觉阈和掩蔽效应。人耳听不到听觉阈以外的信号,这部分信号可以去掉。掩蔽效应指的是当两个响度不同声音作用于人耳时,响度高声音频率成份会影响响度低声音频率成份的感受。掩蔽效应使得响度低声音频率成份的听觉阈提高。 ;数字蜂窝电话通信协议
采样频率:8K
采样精度:16bit
每帧20ms
压缩比:9.7;.wav .voc
.ra .rm .ram
.wma
.mpc .mp4
.ogg .ape; 2.3 语音输入--语音识别技术; ; 2.3 语音输入--语音识别技术; 2.3 语音输入--语音识别技术; 2.3 语音输入--语音识别技术;2.4 语音输出 ; 录音和重放; 文本语音转换(TTS);⑴ 发音器官参数语音合成
⑵ 声道模型参数语音合成
⑶ 波形编辑语音合成技术;2.5 电子乐器数字接口;乐音样本(ROM);1. MIDI(Musical Instrument Digital Interface)协议:是一种电子乐器之间以及电子乐器与电脑之间的统一交流协议,已经成为数字音乐与电子合成乐器国际标准。MIDI不仅定义了电脑音乐程序,音乐合???器及其电子音乐设备交换音乐信号的方式,而且还规定了不同厂家的电子乐器与电脑连接的电缆和硬件及设备之间数据传输的协议,可以解决不同电子乐器之间不兼容的问题。 ; 2.MIDI原理:不对声波进行采样和量化,而是将电子乐器的演奏信息(如键名、力度、时间长短等)记录下来,称为MIDI信息。播放时只需读取MIDI信息,生成所需的乐器声音波形,经放大处理后输出。
特点:1)声音数据量小;
2)易于多个音频文件同时播放;
3)易于编辑;;3.MIDI设备
输入:键盘,击打,吹奏
音序器:记录数据
输出(音源):包括声音发生器、声音模块; 4. MIDI 工作流程;MIDI IN
您可能关注的文档
- 图形的相似的教学分析与建议.doc
- 土家民间美术与儿童美术教育的研究课题.doc
- 土家儿童红色教育实验研究 - 《土家儿童红色教育实验研究》 .doc
- 土木工程概预算——第二章 第三节 设备及工、器具购置费用.ppt
- 土木工程毕业论文 高性能混凝土的研究与发展状况.doc
- 土壤-植物系统中氮锌交互作用研究进展.doc
- 土建造价员培训—建筑识图.ppt
- 在游戏中小班幼儿自信心的培养.doc
- 土豆咖喱猪排饭-全程图解.doc
- 地中海风情园林景观细部要点.ppt
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
最近下载
- AP统计学 2018年真题 (选择题+问答题) AP Statistics 2018 Real Exam and Answers (MCQ+FRQ).pdf
- 110kV变电站的接地网络设计.doc
- 试析《聊斋志异》中的花妖.doc
- 2025年许昌电气职业学院单招职业适应性测试题库(含答案).docx VIP
- 周遂林-四川省优秀毕业生评选答辩.ppt VIP
- 社区老年人养生健康指引.pptx VIP
- 年产100吨头孢拉定原料药车间工艺设计.docx
- 2025年许昌电气职业学院单招职业适应性测试题库含答案.docx VIP
- 外语慕课中国工艺与工匠精神(上海应用技术大学)课后作业期末测试答案.docx
- 产品语义学PPT课件.ppt VIP
文档评论(0)