语音合成基于超声的口腔声学器官运动模型-软件工程专业论文.docxVIP

语音合成基于超声的口腔声学器官运动模型-软件工程专业论文.docx

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音合成基于超声的口腔声学器官运动模型-软件工程专业论文

摘要语音信号处理一直是计算机科学、工程研究的热门领域,语音自动识别和 合 成 技 术 的 初 步 应 用 已 经 得 到 了 普 及,然 而 现 今 大 多 数 成 熟 商 业 系 统 仍 然 无 法提供自然、准确的语音交互体验。在这样的背景下,部分研究学者寄希望于 对发声生理过程进行研究,以此推动语音相关技术的研究。 于是,大量的捕获 声 学 器 官 运 动 的 传 感 器 被 开 发 出 来,尝 试 着 从 不 同 角 度 建 立 发 声 中 声 学 器 官 运动与语音信号间的关系。本 文 提 出 了 从 语 音 信 号 合 成 口 腔 内 部 声 学 器 官 运 动 超 声 图 像 的 框 架,系 统 通 过 对 输 入 的 语 音 信 号 进 行 特 征 提 取,然 后 通 过 映 射 模 型 计 算 出 超 声 图 像 的 特 征 参 数,并 使 用 该 特 征 参 数 重 构 出 超 声 图 像。 本 文 首 先 总 结 介 绍 了 现 有 常 见 映 射 模 型,包 括 基 于 语 言 学 和 基 于 帧 对 帧 的 模 型;然 后 通 过 介 绍 语 音 生 成 模 型 和Silent Speech Interface来 对 该 系 统 的 实 际 应 用 场 景 有 更 深 入 的 理 解; 接 着 描 述 了 本 实 验 所 使 用 的 基 于 超 声 的 多 模 态 语 料 库;最 后 详 细 描 述 了 基 于k-means和Gaussian Mixture Model的映射模型的原理和实现。通 过 客 观 定 量 的 和 主 观 感 知 的 评 价 实 验 可 以 证 明,本 文 提 出 的 方 法 是 具 有 高 准 确 度 和 高 可 用 性 的。 本 文 的 研 究 成 果 有 利 于 研 究 语 音 信 号 与 发 声 器 官 运动间的关系;可应用于发声过程口腔内部的可视化,帮助进行外语学习、发 声恢复以及疾病诊断等;适用于对超声语料库进行模拟和扩充。关键词: 多模态接口;静音语音接口;关节合成;超声;统计映射ABSTRACTSpeech signal processing is one of the most popular research field in Computer Sci- ence research and engineering. Although the basic use of the automatic speech recognition and the text-to-speech technology is universal at present, most commercial system cannot provide an accurate and intuitive interaction experience. In such background, some re- searchers hope the study of relations between the articulatory and acoustic could inspire the speech signal processing research. Nowadays, many sensors has been developed to build these relationships.In this thesis, a framework which synthesize the continuous ultrasound based articula- tory movement from speech signal is proposed. The system take the speech features as input and use mapping methods to synthesize the features of ultrasound images. After that, ultra- sound images will be reconstructed from image features. At first, we describe the existing mapping methods: phonetic based and frame-by-frame based; next, the speech production model and Silent Speech Interface are introduced to give readers a better understanding of the application

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档