情感语音嗓音参数提取与分析.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Report of Phoneitc Research 2013 情感语音的嗓音参数提取与分析* 1 2 2 1 李向伟 ,方强 ,李爱军 ,王红 1. 山东师范大学 信息科学与工程学院,济南 250014 ; 2. 中国社会科学院语言研究所,北京 100732; 文 摘:本文主要寻找嗓音音质中能够区分情感的因素,为下一步的情感语音合成作准备。我们基于同一发音人的七 种不同情感 (七种情感分别为:悲伤、高兴、害怕、厌恶、生气、惊讶、中性)语音样本提取了基频抖动jitter 、振幅 抖动shimmer、谐波噪声率HNR、基频均值meanF0、声门波震动幅度Pulse Amp 、声门波形最大下降率MFDR 等与 嗓音声源密切相关的8 个声学参数并进行统计分析。结果表明在不同情感下一些参数如NAQ,MFDR 具有显著性差异, 而其他参数如shimmer,h1-h2 差异较小。在两种具体情感对组合的分析过程中,各个参数表现出的差异性也有所不同。 关键词:情感语音;嗓音音质参数 语音是人类交流最自然快捷的方式,人们在交 参数归为三类主要影响因素。国内的研究有王磊[3] 谈中不仅传递语言文字本身携带的信息,同时也包 等以jitter 为目标,研究不同情感下jitter 的分布, 含说话人自身主观的情感状态,透露出说话人的情 将jitter 分为确定部分和随机部分,所谓确定部分就 绪,让我们的交流丰富多彩。在传统的语音信号处 是由情感决定的部分,不同的情感有特定的 jitter 理中,往往只关注语音信号要表达的文字意义,忽 模式,随机部分则与情感无关。本文通过量化元音 略了对情感因素分析和建模。现有的语音合成技术 嗓音音质,以提取和分析声门波参数为主,对汉语 得到的声音大多也不带感情色彩。试想如果计算机 普通话中的阴平元音/a/进行分析,寻找嗓音音质特 能够通过说话声音判断人们的情感状态,对不同情 征中能够区分不同情感的成分以及这些成分的作 感的声音输入信号作不同的响应,将会使得很多应 用。 用比如语音导游系统、儿童玩具等更加人性化,更 提取和分析过程如下,我们首先从发音人在七 能满足人们的需求。在现代的语音学研究领域中, 种不同情感(七种情感分别为悲伤、高兴、害怕、 提取和处理说话人的语音情感特征,并以此作为依 生气、厌恶、惊讶、中性)下朗读语料中提取得到 据区分不同的情感是一项具有重大现实意义的研 要分析的音节,本文选取声调为阴平的元音/a/ ,得 究课题。 到七组样本,接下来我们假设 8 个参数(分别为 在我们的说话过程中,气流由肺部通过声门, jitter, shimmer, HNR, meanF0, Pulse Amp, MFDR, 使声带振动产生声带音,声带音经过声腔共振和唇 NAQ 和h1-h2 ,在后续研究不同声调的元音中,音 辐射形成我们听到的声音,在同一个音的不同情感 高的变化范围将作为一个参数加入)可能在不同情 表达中,这一过程任何部分都可能是影响情感听觉 感中具有显著性差异,从样本中分别提取这8 个参 的重要方面。在情感语音的声学特征分析中,过去 数,作统计分析得到不同情感下每个参数的差异显 的研究主要集中在基频、音强、音长等特征上[1], 著性。 因为这些特征值便于使用计算机软件进行提取,并 1 情感语音数据库 且在区分某些情感上也具有一定的作用,但还不足 以作为准确预测说话人情感的依据。近来的研究表 研究语料来自中国社会科学院语音与言语科

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档