- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 卷第 期
31 4 东南大学学报(自然科 学版 ) Vol31No4
年 月
2001 7 ( ) July2001
JOURNALOFSOUTHEASTUNIVERSITY NaturalScienceEdition
基于PSOLA算法的语音编码压缩的研究与实现
曹 钢 徐宏炳
(东南大学计算机科学与工程系,南京 210096)
摘要:以时域基音同步叠加( )技术和一个全汉语单音节库为合成单元进行汉语语音
TDPSOLA
合成,合成的语音清晰度和自然度很高 但是这样的系统语音库太大,不利于在小型设备中实
.
现,影响了语音合成的进一步应用 本文针对此问题,在研究 律压缩的基础上,采用自适应
. A
量化和自适应预测的技术,以较少增加合成运算量复杂度为代价,对语音库的编码实现压缩,
使压缩后的语音库减小了约一半,大大减小了所需的存储空间 并且利用压缩后的语音库合成
.
语音,基本上不影响合成后的语音质量,从而进一步扩展了语音合成的应用.
关键词:基音同步叠加;编码压缩;自适应预测;自适应量化
中图分类号: 文献标识码: 文章编号: ( )
TN91233 A 1001-0505200104003604
随着多媒体技术的不断发展,近 年来,在语音合成领域中涌现出大量新技术和新设计 过去由于计
20 .
算机存贮容量的限制,语音合成通常都采用参数合成方法,如共振峰、 , 等参数合成方法,虽然合成
LPCLSP
单元的存贮量比较小,但是由于汉语语音参数多,抽取的算法比较复杂,合成语音的自然度和清晰度都比
[]
较差1 .
汉语普通话的音节有一些特点,如它是普通话最自然和最基本的语音单位,数目较少,具有相对的稳
[]
2
定性 等,因此在汉语语音合成中一般都是利用汉字全音节作音库 在传统简单的波形拼接中,没有考虑
.
到音节在连续语流中的发音与单音节发音的不同,所以合成的自然度不高,“机器味”较重 世纪 年
.20 80
代末,基音同步叠加法( )技术的研究使得在音节拼接时能比较灵活地调节其音高和时长,使合成的
PSOLA
音色和自然度大大提高,因而该技术得到了广泛的应用.
为了让语音合成技术从实验室走向市场,扩大文语
合成的应用场合,目前对汉语文—语转换系统而言,减
小音库容量也是一个重要课题 高质量的汉语文—语转
.
换系统(见图 )一般需要几兆到几十兆字节,甚至更多
1
的存储容量,这在以 机或工作站为硬件平台的应用
PC
您可能关注的文档
- 听觉词语学习测验的社区老人常模.PDF
- 听含羞草的声音社交焦虑症概念1界定与统计.PDF
- 含科技与生活-facultypccuedutw.DOC
- 吸菸行为-康宁大学.PPT
- 员工福利手册-上海交通大学医学院.DOC
- 听觉统合训练在孤独症儿童中应用效果的Meta分析.PDF
- 呼伦贝尔生态功能区草地退化的时空特征-资源科学.PDF
- 咨询历史文化课05221569-静冈.PDF
- 哈尔滨工业大学2012寒假社会实践指导手册共青团哈尔滨工业大学.DOC
- 哀牢山常绿阔叶林优势树种热值与养分特征.PDF
- 基于Rss的个人信息环境设计研究.PDF
- 基于OAuth20协议的安全授权模型研究.PDF
- 基于VC的OpenGL编程讲座之-----概述转帖作者刘涛出处.DOC
- 基于LSTM与随机森林混合构架的钓鱼网站识别研究-工程科学与技术.PDF
- 基于NSST域灰度关联分析的多聚焦图像融合方法.PDF
- 基于WAP的移动电子商务支付系统安全性改进-计算机系统应用.PDF
- 基于TMS320C6416的光电实时跟踪自引导系统的实现.PDF
- 基于WoS数据的我国气象学者合作模式实证分析-南京信息工程大学.PDF
- 基于中职生职场表现的中职教育培养质量分木斤.PDF
- 基于XML内容和结构的模糊查询-JournalofNortheasternUniversity.PDF
文档评论(0)