网站大量收购独家精品文档,联系QQ:2885784924

语音信号合成器设计与实现.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号合成器设计与实现

语音信号合成器设计与实现 通信工程1204班 指导教师:王祥青 组员 徐小阳 蒋高峰 程军生 贾玉飞 吕 凡 背景 1.1 概述 语音是人类相互之间进行交流时使用最多、最自然、最基本也是最重要的信息载体。在高度信息化的今天,语音处理的一系列技术及其应用已成为信息社会不可或缺的重要组成部分。语音的产生是一个复杂的过程,包括心理和生理等方面的一系列动作。当人需要通过语音表达某种信息时,首先是这种信息以某种抽象的形式表现在说话人的大脑里,然后转换为一组神经信号,这些神经信号作用于发声器官,从而产生携带信息的语音信号。 通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类特有的功能,声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。 语音合成的目的就是让计算机说话。最简单的语音合成应当是语音响应系统,其实现技术非常简单。在计算机内建立一个语音库,将可能用到的单词,词组或一些句子的声音信号编码后存入计算机,当键入所要的字,词组或句子代码时,就能调出对应代码信号,并转换成声音。 1.2matlab Matlab 是美国 Math Works 公司推出的一种面向工程和科学计算的交互式计算软件,它以矩阵运算为基础,把计算、可视化、程序设计融合到了一个简单易用的交互式工作环境中。同时由于Matlab 是一个数据分析和处理功能十分强大的工程实用软件,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。 随着计算机技术和信息技术的发展,语音交互已经成为人机交互的必要手段,而语音信号的采集和处理是人机交互的前提和基础。声卡是计算机对语音信号进行加工的重要部件,它具有对信号滤波、放大、采样保持、A/D和D/A转换等功能。尽管在Windows 附件的娱乐中带有一个录音机,通过它可以驱动声卡采集语音信号并保存为语音文档。但是要对采集的信号进一步分析处理就必须另外编程或通过其它软件,而且Windows附件中的录音机功能极其有限且不能扩展。 设计目的 (1)自行产生两个语音信号(男声和女声) (2)分别对两路信号进行频谱分析和特征提取,并画出两路语音信号的频谱图 (3)试将两语音信号分别合成为男声或女声 (4)播放合成后的语音信号 设计原理 3.1.1语音信号的频谱分析过程 傅里叶频谱分析是语音信号频域分析中广泛采用的一种方法。语音波是一个平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。进行频谱分析时,在时域数据进行短时FFT处理之前都要进行加窗处理。在FFT处理之后,普通频谱分析可以进行频域上的滤波处理,从而使频谱更加平滑。最后IFFT处理观察恢复后的时域信号图形,频谱分析过程。 3.1.2短时傅里叶变换(频谱分析) 傅里叶频谱分析的基础是傅里叶变换,用傅里叶变换及其反变换可以求得傅里叶谱、自相关函数、功率谱、倒谱。由于语音信号的特性是随着时间缓慢变化的,由此引出语音信号的短时分析。如同在时域特征分析中用到的一样,这里的傅里叶频谱分析也采用相同的短时分析技术。 信号x(n)的短时傅里叶变换定义为: 式中, 为窗口函数。 可以从两个角度理解函数的物理意义:第一种解释是,当n固定时,n= 如,则 是将窗函数的起点移至 处截取信号x(n),再做傅里叶变换而得到的一个频谱函数。这是直接将频率轴方向来理解的。另一种解释是从时间轴方向来理解,当频率固定时,例如 ,则可以看做是信号经过一个中心频率为 的带通滤波器产生的输出。这是因为窗口函数 通常具有低通频率响应,而指数 对语音信号有调制的作用,使频谱产生移位,即将x(n)频谱中对应于频率 的分量平移到零频。 3.1.3 快速傅里叶变换 有限长序列可以通过离散傅里叶变换(DFT)将其频域也离散化成有限长序列。但

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档