男女声变换报告.docVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

DSP课程实验报告

——男女声变换

学??院:电子信息工程学院

指导教师:??老师

学??生:

北京交通大学电工电子教学基地

2015年6月6日

目录

1??设计任务书??1

2??设计内容??1

3??设计方案、算法原理说明??1

3.1??基于时域变换??1

3.2??基于频域变换??1

3.3??基于时域识别??2

3.4??基于频域识别??2

3.5??阈值+加权(评分)的判决方法??2

4??程序设计、调试与结果分析??4

4.1??基于时域变换??4

4.2??基于频域变换??5

4.3??基于时域识别??7

4.4??基于频域识别??9

4.5??时域和频域识别优缺点??9

5??设计(安装)与调试的体会??10

5.1.1??程序设计、调试与结果分析??10

6??参考文献??15

7??附录1DMA中断服务程序----基于时域变换??15

8??附录3?基于时域识别??20

1设计任务书

语音性别变换是网络聊天、数字娱乐和安全领域中的热门课题。语音性别变换的主要任务是对语音进行某种变换使之产生性别变化的特效,例如在男声、女声、老年人声和童声之间互相转换,达到伪装的效果。本设计要求采用DSP实验系统实现男声和女声音调的变换功能。

基本部分:??(1)利用DSP的DMA方式对外部信号进行实时采集、传输与处理。

(2)使用C语言编写并实现男女生声音的实时变换。

发挥部分:(1)能够智能识别男女声音。

(2)通过算法中参数值的选择,调整信号频率变化的程度,实现男女声音相互转化程度可变。

2设计内容

1、编写C语言程序,并在CCS集成开发环境下调试通过。

2、实现设计所要求的各项功能。

3、按要求撰写设计报告。

3设计方案、算法原理说明

人类基音的范围约为70~350Hz左右,由于生理结构的不同,男性与女性的声音呈现出不同的听觉特征,男声的基音频率大都在100—200HZ之间,而女声则在200—350HZ之间。如图所示女声约为男声的1.5~2倍。鉴于男女声存在基音频率的明显差异,基音频率可作为男女声变换的依据。

图3.1?男女基频分布

3.1基于时域变换

信号在时域上的L倍内插,引起原序列频谱的L倍压缩。信号在时域上的M倍抽取,引起原序列频谱的M倍扩张。两者结合,可实现信号频率的L/M倍变化。当LM时,频率缩小;当LM时,频率扩张。因此内插加抽取可以实现信号频率的变化,基于此,可以实现男声女声基频的变换,从而实现男女声变换的目的。

3.2基于频域变换

通过对信号作FFT,变换到频域,对整个频谱左移或者右移100Hz,在做IFFT变回时域,也可以实现男声女声基频的变换,从而实现男女声变换的目的。控制左移和右移的程度,实现男女声变换程度可调。

3.3基于时域识别

女声基频大约高于男声基频100Hz,体现在时域上信号震荡比较剧烈,过零点次数较多,通过统计语音信过零点的次数,多者为女声,少者为男声,从而达到识别男女声的目的。

3.4基于频域识别

通过大量观察语音信号的频谱,发现频谱大致呈现单个最大峰特性(见图3.2),并且频谱峰值对应的频率刚好是基频。通过对信号作FFT,计算其幅度谱,寻找幅度谱最大值对应的频率,高则为女声,低者为男声。

图3.2语音信号单个最大峰

3.5阈值+加权(评分)的判决方法

男女声识别是基于一个统计量进行判决的,基于时域识别法的统计量是平均过零点次数,基于频域识别法的统计量是幅度谱最大值对应的频率小于180Hz的平均次数。一次的统计量由于各种随机干扰,不能确保其真实性。我们自己设计了阈值+加权(评分)的判决方法。现以平均过零点次数的判决为例进行详细说明。

图3.3阈值+加权(评分)的判决方法

如图3.3所示,过零点次数越多,越有把握判决是女声,反之亦然。

●如果过零点平均次数45average55,则不进行任何操作,即不能判决的模糊状态,这主要是因为其它不确定干扰造成的。

●如果55average60,则女声得分female_score加1;

●如果average60,则女声得分female_score加2;

●如果40average45,则男声得分male_score加1;

●如果average40,则男声得分male_score加2;

之所以引入上面的评分机制,只要是加快判决时间与增加算法的稳健性。因为随机干扰的存在,即使在多次统计取平均后,男声的平均过零点次数有可能突然跳进女声的判决域,女声的平均过零点次数也有可能突然跳进男声的判决域,引起误判。引入评分机制后,这

文档评论(0)

8d758 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档