一种基于小波和快速傅里叶变换的学习型歌唱系统.PDF

下载文档

6
0
约1.52万字
约 3页
2017-06-24 发布于天津
举报
版权申诉
保障服务

一种基于小波和快速傅里叶变换的学习型歌唱系统.PDF

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

一种基于小波和快速傅里叶变换的学习型歌唱系统

Computer Engineering and Applications 计算机工程与应用 2012 ，48 （3） 143 一种基于小波和快速傅里叶变换的学习型歌唱系统潘伟洲，单志龙，邱景钦，袁世超，黄煜廉 PAN Weizhou, SHAN Zhilong, QIU Jingqin, YUAN Shichao, HUANG Yulian 华南师范大学计算机学院，广州 510631 School of Computer, South China Normal University, Guangzhou 510631, China PAN Weizhou, SHAN Zhilong, QIU Jingqin, et al. Intelligent singing system based on wavelets transform and fast Fourier trans- form. Computer Engineering and Applications, 2012, 48 （3 ）：143-145. Abstract ：Speech recognition and text to speech technologies enable computers to understand human languages and read as a human respectively. In this paper, an intelligent singing system is proposed. The system uses percussion locating method to locate every mo- ment when each word of lyric occurs. Daubechies Wavelets Transform （DWT ）and Fast Fourier Transform （FFT ）are used to calculate the fundamental frequency. The computer sings the song with text to speech technology. Key words ：Melody Lyric to Song （MLTS ）; singing; Daubechies Wavelets Transform（DWT ）; Fast Fourier Transform（FFT ）; text to speech 摘要：语音识别和合成技术分别实现了计算机理解人类语言和模仿人类阅读文本的功能，提出了一种实现计算机学习并演唱歌曲的系统。系统运用敲击定位法定位发音时刻，然后利用Daubechies 小波变换和快速傅里叶变换计算出对应的基频，采用语音合成技术输出声音。关键词：MLTS 技术；歌唱；Daubechies 小波变换；快速傅里叶变换；语音合成 DOI ：10.3778/j.issn. 1002-8331.2012.03.042 文章编号：1002-8331（2012 ）03-0143-03 文献标识码：A 中图分类号：TP393 1 引言由于所有歌曲都是由各个不同频率的音阶和其延续时间在计算机系统中，语音应用技术作为信息技术处理领域的长短来实现的，所以电脑学唱一首歌的过程也可以像人一的一项前沿技术，主要包括语音识别（Speech Recognition，SR）样：计算机先“听”一首歌，然后“听”出哪个地方唱哪个字和发 [1] 哪个调，再“看”着歌词唱出来。“听”的过程就是一个分析的过和语音合成（Text to Speech ，TTS ）技术。语音识别技术是指计算机系统能够根据输入的语音识别出其代表的具体意义，程，根据歌曲的信息和与之相匹配的文本歌词提取相关的音进而完成相应的功能。通过语音识别技术，计算机可以“听” 乐信息特征值，而“唱”的过程实际上是一个根据分析得到的懂人类的语言。而语音合成技术则是将计算机自己产生的或特征值调用音库发声的过程，该过程如图2 所示。外部输入的文字信息，按语音处理规则转换成语音信号输出。通过语音合成技术，计算机具有了“说”的能力。语音合 wav 音频