三维几何声道建模.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Report of Phoneitc Research 2013 三维几何声道建模* 1 2 1 1 1,3 宋婵 ,方强 ,王宇光 ,魏建国 ,党建武 (1.天津大学 计算机科学与技术学院,天津 300072 ;2. 中国社会科学院,北京 100732 ; 3.北陆无端科学技术大学院大学,日本) 文 摘:生理发音模型可以应用于语音生成,语音分析,语音教学等各个方面。本研究,我们基于汉语普通话核磁共振发 音数据库构建了一个汉语普通话发音的几何模型。模型的构建分为两个部分,数据标注和模型控制参数抽取。控制参数抽 取是对第一阶段标记的数据进行分析,方法采用线性成分分析法。目的是能够利用较少具有明显物理意义的参数来描述复 杂的发音器官的位置和形状,实现对复杂声道形状的控制。分析结果显示,每个发音器官可用三个以内参数来很好的描述, 且平均重构误差小于1mm。 关键词:生理发音模型;发音器官形状;线性成分分析 中图分类号: 分类号 1;分类号2 在语音研究领域,语音生成作为一个重要的 文将基于汉语普通话的核磁共振数据库,建立汉 分支已经受到人们越来越多的关注。基于生理的 语的发音模型。 发音模型有助于我们验证和统合现阶段对于语音 本文组织结构如下,第一部分主要介绍所选 产生的生理和物理机制的理解,推动语音产生研 用数据库的信息;第二部分给出了对数据库图像 究的进一步发展。早期用于生理建模的方法有神 进行标注的方法,以及每个发音器官标记后的结 经肌 肉建模和 几何建模 。前者的 代表是 果形状;对标记结果进行分析的方法在第三部分 Dang-Honda 模型[1]等,他们通过不同肌肉力的 介绍;分析结果则于第四部分给出并解释;最后 组合来控制发音器官的运动从而描述整个声道形 第五部分介绍了尚且存在的问题和下一步的研究 状的变化。几何模型只需要对不同声道的几何形 思路。 状进行分析,找出声道形状的主要控制因子,通 1 数据库 过调整这些因子的数值达到控制声道形状的目 的。 几何模型的构建又有二维中矢面声道形状建 模和三维声道形状建模两种。二维模型相对于三 维模型来说,构建简单,因而在建模早期被很多 人使用。比如 Engwall和 Badin 在早期的声道建 模中都曾构建过二维模型[2]。但是二维中矢面模 型在计算声道面积函数的时候只能采用估算的方 法;加上一些发音对应的声道形状是中矢面上封 a. b. 闭,两边部分分开,如/l/,无法用二维模型正确 描述。因此,三维模型的构建逐渐引起人们的重 图 1 数据库中的 MRI 图像和三维显示图像,其中a 是数据 视。对三维建模的研究也从最初Engwall基于瑞 典人建立的三维舌头模型[3],到后来 Badin 基于 库中原始 MRI 图像,b 是三维图像叠加显示的形状 法语发音构建了三维发音器官模型[4]。 我们选用的数据库是汉语普通话发音 MRI数 综上所述,国外对发音模型做了大量的工作, 据库,数据库共包括8个发音人,每个发音人共 而针对汉语发音的三维发音模型的研究很少。本 *基金项目:国家科学基金面上项目(NO、基金重点 项目(NO.6123

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档