- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音合成基于超声的口腔声学器官运动模型-软件工程专业论文
摘要语音信号处理一直是计算机科学、工程研究的热门领域,语音自动识别和 合 成 技 术 的 初 步 应 用 已 经 得 到 了 普 及,然 而 现 今 大 多 数 成 熟 商 业 系 统 仍 然 无 法提供自然、准确的语音交互体验。在这样的背景下,部分研究学者寄希望于 对发声生理过程进行研究,以此推动语音相关技术的研究。 于是,大量的捕获 声 学 器 官 运 动 的 传 感 器 被 开 发 出 来,尝 试 着 从 不 同 角 度 建 立 发 声 中 声 学 器 官 运动与语音信号间的关系。本 文 提 出 了 从 语 音 信 号 合 成 口 腔 内 部 声 学 器 官 运 动 超 声 图 像 的 框 架,系 统 通 过 对 输 入 的 语 音 信 号 进 行 特 征 提 取,然 后 通 过 映 射 模 型 计 算 出 超 声 图 像 的 特 征 参 数,并 使 用 该 特 征 参 数 重 构 出 超 声 图 像。 本 文 首 先 总 结 介 绍 了 现 有 常 见 映 射 模 型,包 括 基 于 语 言 学 和 基 于 帧 对 帧 的 模 型;然 后 通 过 介 绍 语 音 生 成 模 型 和Silent Speech Interface来 对 该 系 统 的 实 际 应 用 场 景 有 更 深 入 的 理 解; 接 着 描 述 了 本 实 验 所 使 用 的 基 于 超 声 的 多 模 态 语 料 库;最 后 详 细 描 述 了 基 于k-means和Gaussian Mixture Model的映射模型的原理和实现。通 过 客 观 定 量 的 和 主 观 感 知 的 评 价 实 验 可 以 证 明,本 文 提 出 的 方 法 是 具 有 高 准 确 度 和 高 可 用 性 的。 本 文 的 研 究 成 果 有 利 于 研 究 语 音 信 号 与 发 声 器 官 运动间的关系;可应用于发声过程口腔内部的可视化,帮助进行外语学习、发 声恢复以及疾病诊断等;适用于对超声语料库进行模拟和扩充。关键词: 多模态接口;静音语音接口;关节合成;超声;统计映射ABSTRACTSpeech signal processing is one of the most popular research field in Computer Sci- ence research and engineering. Although the basic use of the automatic speech recognition and the text-to-speech technology is universal at present, most commercial system cannot provide an accurate and intuitive interaction experience. In such background, some re- searchers hope the study of relations between the articulatory and acoustic could inspire the speech signal processing research. Nowadays, many sensors has been developed to build these relationships.In this thesis, a framework which synthesize the continuous ultrasound based articula- tory movement from speech signal is proposed. The system take the speech features as input and use mapping methods to synthesize the features of ultrasound images. After that, ultra- sound images will be reconstructed from image features. At first, we describe the existing mapping methods: phonetic based and frame-by-frame based; next, the speech production model and Silent Speech Interface are introduced to give readers a better understanding of the application
您可能关注的文档
- 基于视觉的卫星在轨自维护操作的研究-机械电子工程专业论文.docx
- 吸附光催化联合处理亚甲基蓝的研究-环境科学专业论文.docx
- 通络干预对过劳致血管内皮功能障碍的保护作用研究-中西医结合临床专业论文.docx
- 小跨高比钢筋混凝土连梁的抗震性能与加固方法研究-结构工程专业论文.docx
- 汽车转向节半封闭式锻造工艺研究-材料加工工程专业论文.docx
- 中国北方广布树种油松的谱系地理学研究-生态学专业论文.docx
- 外用盐酸罂粟碱抑制游离植皮术后挛缩的实验研究-整形外科专业论文.docx
- 轿车发动机悬置减振特性的仿真分析-车辆工程专业论文.docx
- 锌胁迫对小麦种子萌发及幼苗生理生化特性的影响-生物化学与分子生物学专业论文.docx
- 铜合金与钨钼间润湿性的研究-材料加工工程专业论文.docx
- 数据仓库与中间件技术在湖南国税数据集中中的应用-计算机技术专业论文.docx
- 铜合金水平连铸数值仿真研究及其应用-农业机械化专业论文.docx
- 陕西关中农村新民居模式研究-建筑设计及其理论专业论文.docx
- 脉冲电子顺磁共振谱仪研制及应用-粒子物理与原子核物理专业论文.docx
- 空地ofdma系统的资源分配算法研究及fpga实现-通信与信息系统专业论文.docx
- 基于肌肉运动的人脸表情识别-计算机应用技术专业论文.docx
- 有机纳米粒子制备、表面功能化及其生物应用-无机化学专业论文.docx
- 网络课程中的交互设计分析-通信与信息系统专业论文.docx
- 新型hsp90抑制剂biib021增强食管鳞癌细胞放射敏感性的研究-肿瘤学专业论文.docx
- 基于迭代方法的超声波ct温度场重建-控制科学与工程专业论文.docx
文档评论(0)