声音的图形量化探讨.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
声音的图形量化探讨.pdf

技术论坛 Technical Forum 声音的图形量化探讨 许含坤 / 福建信息职业技术学院 摘 要:本文通过对声音文件及音频和音调音量的量化分析,傅立叶变换,对声音、音频、音调、音量的量化处理,编 程实现了一种声音文件图形化过程。 关键词:音频;音调;图形 实世界中,声音是看不见摸不到的。它是一 整个幅度划分成有限个小幅度(量化阶距)的集合,把落 现种在空气中传播的无形波,对声波波形进行 入某个阶距内的样值归为一类,并赋予相同的量化值。 采样后,利用模拟数字的转换技术,对形成 音频文件中存储的一般都是压缩过的PCM数据,经过 的声音文件进行分析量化,就可以在屏幕上实时地画出其 解码后就变成了可处理的PCM数据。 形状。这个完整的过程是一个复杂的过程,本文就这种过 1.3 傅立叶变换 程的实现中的一个环节进行分析,阐述一个简单的声音的 傅里叶变换是一种线性的积分变换,通常在将信号在 图形化描述,并利用编程语言给出了示例的计算机程序实 时域和频域之间变换时使用。就声音音调识别来说,傅立 现。 叶变换可以将以时间为自变量的振幅函数vol (t )变换到 声音文件的图形化描述,其本质上是以图形化的方式 以频率为自变量的振幅函数vol (f )。 来还原声音文件所记录的原始采集信号。而图形化波形显 1.4 音调的识别流程 示却是以图形化的方式还原声音文件所记录的声音信号。 规定一个Δt ,假设在Δt 时间段内,音调是不变的.对 声音文件一般分为:音频、音调和音量等。如何对这 vol (t )进行分割,分成[0,Δt] ,[ Δt ,2 Δt] … [t- Δt ,t] 些进行量化描述,是一个要解决的问题。 多个区间。分别对vol (t )的多个区间进行傅立叶变换, 1 声音文件的结构及音频音调分析 得出频率分布谱,找到最大振幅对应的频率(一般情况下 声音文件中记录声音原始信息,因此,理论上任何可 音量最大的频率即为基本频率)。更好的方法则是利用基 以还原声音的文件都可以作为图形显示的信息源。声音的 本频率与音调变换关系,对得出来的频率进行变换,得到 记录方式有多种形式,最简单而又最能保持声音本色的方 的pitch (t ),即为声音的音调在变化谱线。 法是直接记录波形。 这种变形的傅立叶变换即为短时傅立叶变换能够观察 1.1 音调 出信号瞬时频率的信息。 基频(fundamental frequency ),指当发声体由于震动 2 编程实现图形化过程 而发出声音时,声音一般可以分解为许多单纯的正弦波, function pitch() 也就是说所有的自然声音基本都是由许多频率不同的正弦 //读取音频文件 波组成的,其中频率最低的正弦波即为基音,而其他频率 [stream, sample_rate] = audioread(test.wma); 较高的正弦波则为泛音。

文档评论(0)

higu65 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档