语音合成系统关键技术.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音合成系统关键技术

语音合成系统的关键技术 清华大学计算机系智能技术与系统国家重点实验室? 陶建华 蔡莲红 ?计 算 机 语 音 合 成 系 统 又 称 文 语 转 换 系 统(TTS 系 统), 它 的 主 要 功 能 是 将 计 算 机 中 任 意 出 现 的 文 字 转 换 成 自 然 流 畅 的 语 音 输 出。 一 般 认 为, 语 音 合 成 系 统 包 括 三 个 主 要 的 组 成 部 分: 文 本 分 析 模 块、 韵 律 生 成 模 块 和 声 学 模 块。 文 本 分 析 语 音 合 成 系 统 首 先 处 理 的 是 文 字, 也 就 是 它 要 说 的 内 容。 文 本 分 析 的 主 要 功 能 是 使 计 算 机 能 从 这 些 文 本 中 认 识 文 字, 进 而 知 道 要 发 什 么 音、 怎 么 发 音, 并 将 发 音 的 方 式 告 诉 计 算 机。 另 外, 还 要 让 计 算 机 知 道, 在 文 本 中, 哪 些 是 词, 哪 些 是 短 语 或 句 子, 发 音 时 应 该 到 哪 里 停 顿 及 停 顿 多 长 时 间 等。 其 工 作 过 程 可 以 分 为 三 个 主 要 步 骤: (1) 将 输 入 的 文 本 规 范 化。 在 这 个 过 程 中, 要 查 找 拼 写 错 误, 并 将 文 本 中 出 现 的 一 些 不 规 范 或 无 法 发 音 的 字 符 过 滤 掉。 (2) 分 析 文 本 中 词 或 短 语 的 边 界, 确 定 文 字 的 读 音, 同 时 分 析 文 本 中 出 现 的 数 字、 姓 氏、 特 殊 字 符、 专 有 词 语 以 及 各 种 多 音 字 的 读 音 方 式。 (3) 根 据 文 本 的 结 构、 组 成 和 不 同 位 置 上 出 现 的 标 点 符 号, 确 定 发 音 时 语 气 的 变 换 以 及 不 同 音 的 轻 重 方 式。 最 终, 文 本 分 析 模 块 将 输 入 的 文 字 转 换 成 计 算 机 能 够 处 理 的 内 部 参 数, 便 于 后 续 模 块 进 一 步 处 理 并 生 成 相 应 的 信 息。 传 统 的 文 本 分 析 主 要 是 基 于 规 则(Rule  based) 的 实 现 方 法。 其 主 要 思 路 是 尽 可 能 地 将 文 字 中 的 分 词 规 范、 发 音 方 式 罗 列 起 来, 并 总 结 出 规 则, 依 靠 这 些 规 则 进 行 文 本 处 理, 以 获 得 需 要 的 参 数。 具 有 代 表 性 的 方 法 有: 最 大 匹 配 法、 反 向 最 大 匹 配 法、 逐 词 遍 历 法、 最 佳 匹 配 法、 二 次 扫 描 法 等。 这 些 方 法 的 优 点 在 于 结 构 较 为 简 单、 直 观, 易 于 实 现; 缺 点 是 需 要 大 量 的 时 间 去 总 结 规 则, 且 模 块 性 能 的 好 坏 严 重 依 赖 于 设 计 人 员 的 经 验 以 及 他 们 的 背 景 知 识。 由 于 这 些 方 法 能 取 得 较 好 的 分 析 效 果, 因 此, 直 到 目 前, 它 们 依 然 被 广 泛 使 用。 但 是 近 几 年 来, 随 着 计 算 机 领 域 中 数 据 挖 掘 技 术 的 发 展, 许 多 统 计 学 方 法 以 及 人 工 神 经 网 络 技 术 在 计 算 机 数 据 处 理 领 域 中 获 得 了 成 功 的 应 用, 计 算 机 从 大 量 数 据 中 自 动 提 取 规 律 已 完 全 可 能 并 正 在 实 现。 在 此 背 景 下, 出 现 了 基 于 数 据 驱 动(Data driven) 的 文 本 分 析 方 法, 具 有 代 表 性 的 有: 二 元 文 法 法(Di Grammar Method)、 三 元 文 法 法(Tri Grammar Method)、 隐 马 尔 可 夫 模 型 法(HMM Method) 和 神 经 网 络 法(Neural Network Method) 等。 一 些 比 较 著 名 的 系 统, 如IBM 的 语 音 产 品 就 采 用 了 隐 马 尔 可 夫 模 型 法。 这 类 方 法 的 特 点 是, 设 计 人 员 根 据 统 计 学 或 人 工 神 经 网 络 方 面 的 知 识, 设 计 出 一 种 可 训 练 的 模 型, 并 用 大 量 已 经 存 在 的 数 据 去 训 练, 将 训 练 得 到 的 模 型 用 于 文 本 分 析, 而 系 统 设 计 人 员 并 不 需 要 太 强 的 语 言 学 背 景 知 识。 对 于 工 程 技 术 人

文档评论(0)

sy78219 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档