一种用于语音可视化的语谱图彩色增强方法 .pdfVIP

一种用于语音可视化的语谱图彩色增强方法 .pdf

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)中华人民共和国国家知识产权局

(12)发明专利说明书

(10)申请公布号CN102044254A

(43)申请公布日2011.05.04

(21)申请号CN200910235643.3

(22)申请日2009.10.10

(71)申请人北京理工大学

地址100081北京市海淀区中关村南大街5号

(72)发明人赵胜辉董欣玮王晶匡镜明

(74)专利代理机构北京理工大学专利中心

代理人张利萍

(51)Int.CI

G10L21/06

权利要求说明书说明书幅图

(54)发明名称

一种用于语音可视化的语谱图彩色

增强方法

(57)摘要

本发明为一种用于语音可视化的语

谱图彩色增强方法,包括对原始语音信号

分帧、加窗,提取每帧信号在各个特征频

带内的短时能量值;将语音信号的有效频

带平均分为N个特征频带,分别计算每帧

语音信号在N个特征频带内的能量值;以

各个特征频带内的能量值为参数对相应特

征频带预先设定的色彩饱和度进行修正;

对N个频带内的能量值进行归一化处理;

利用归一化后的能量值对N特征频带既定

色彩的饱和度进行修正;将语音信号N个

特征频带的修正后的色相、饱和度、亮度

利用色彩学转换公式转化为RGB三原色

值;绘制直方图。本发明语音信号色彩生

成模块,通过不同色彩反映语音信号频谱

的能量集中区域,易于辨识;动态反映出

发音的帧间变化,符合发音规律。

法律状态

法律状态公告日法律状态信息法律状态

权利要求说明书

1.一种用于语音可视化的语谱图彩色增强方法,其特征在于:包括以下步骤:

第一步:对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量

值;

第二步:将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号

在N个特征频带内的能量值;

mathsmathmrowmsubmiE/mimim/mi/msubmo=/momun

derovermiSigma;/mimrowmin/mimo=/momim/mi/mrow

mrowmim/mimo+/momiN/mimo-

/momn1/mn/mrow/munderovermsupmsubmis/mimiw/mi

/msubmn2/mn/msupmrowmo(/momin/mimo)/mo/mrow

mo-/momo-/momo-

/momrowmo(/momn1/mnmo)/mo/mrow/mrow/math/mat

hs

其中,m是窗的起点,N是窗长(点数);

第三步:以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度

进行修正;对N个频带内的能量值进行归一化处理;

第四步:利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;

第五步:将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转

换公式转化为RGB三原色值;

第六步:绘制直方图,横轴为时间轴,以帧为单位,纵轴为1-N,表示相应的N个

特征频带,对每帧的N个特征频带进行着色,其色彩为修正饱和度之后所对应的

RGB配色。

2.根据权利要求1所述的一种用于语音可视化的语谱图彩色增强方法,其特征在于:

上述第三步中归一化处理时利用的最大值为第2-第N个频带的能量最大值

Esubm/sub,如果第1个能带的能量大于Esubm/sub,则直接将其归一化

后的数值直接置1,即:

Esubm/sub=max(Esub2/sub:Esub12/sub)(2)

mathsmathmrowmsupmsubmiE/mimn1/mn/msubmopri

me;/mo/msupmo=/momfencedmtablemtrmtdmsubmiE/mi

mn1/mn/msubmo,/mo/mtdmtdmsubmiE/mimn1/mn/m

submolt;/mom

文档评论(0)

135****1503 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档