- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
系统语音识别的研究现状和应用前景.doc
语音识别的研究现状和应用前景
语音识别技术并不是一夜之间冒出来的神话,早在三四十年前,在美国的一些大学和研究单位,就已经有人开始从事这一方向的研究,并有一些相关论文发表;七十年代前后,研究的脉络日渐清晰,于是贝尔实验室和国际商用机器公司(IBM)等都先后建立了专门的研究机构。今天这两家公司在这一领域都已取得了显著的成果,并且在商业上应用成功,但贝尔实验室主要是偏重于电信方面应用的语音识别系统,如电话查询等;而IBM则偏重于商务应用,因而在连续语音识别上取得了不小的成功。
不 谈 商 业 方 面 的 应 用, 事 实 上, 很 多 家 公 司 都 提 供 语 音 识 别 的 引 擎 , 并 且 都 表 示 能 支 持 微 软 的SAPI。 看 一 看 SAPI4.0 SUITE 就 不 难 发 现, 微 软 在 这 方 面 的 研 究 并 不 逊 于 任 何 一 家 公 司, 只 是 很 奇 怪 它 居 然 没 有 将 成 果 商 业 化。 微 软 同 时 提 供 了 一 系 列 引 擎, 如 Speech Recognition ( 语 音 识 别)、Command Control ( 发 布 指 令 并 控 制)、Phone Query ( 电 话 语 音 识 别)、Text to speech( 文 本 语 音 转 换) 等。
今 天, 许 多 用 户 已 经 能 享 受 到 语 音 技 术 的 优 势 了, 可 以 对 计 算 机 发 送 命 令, 或 者 要 求 计 算 机 记 录 下 用 户 所 说 的 话, 以 及 将 文 本 转 换 成 声 音 朗 读 出 来。 尽 管 如 此, 距 离 真 正 的 人 机 自 由 交 流 的 前 景 似 乎 还 远。 目 前, 计 算 机 还 需 要 对 用 户 作 大 量 训 练 才 能 识 别 用 户 的 语 音。 并 且, 识 别 率 也 并 不 总 是 尽 如 人 意。 换 言 之, 语 音 识 别 技 术 还 有 一 段 路 需 要 走, 要 做 到 真 正 成 功 的 商 业 化, 它 还 必 须 在 很 多 方 面 取 得 突 破 性 进 展, 这 实 际 就 是 其 技 术 的 未 来 走 向。
算 法 模 型 方 面 , 需 要 有 进 一 步 的 突 破。
目 前 能 看 出 它 的 一 些 明 显 不 足, 尤 其 在 中 文 语 音 识 别 方 面, 语 言 模 型 还 有 待 完 善, 因 为 语 言 模 型 和 声 学 模 型 正 是 听 写 识 别 的 基 础, 这 方 面 没 有 突 破, 语 音 识 别 的 进 展 就 只 能 是 一 句 空 话。 目 前 使 用 的 语 言 模 型 只 是 一 种 概 率 模 型, 还 没 有 用 到 以 语 言 学 为 基 础 的 文 法 模 型, 而 要 使 计 算 机 确 实 理 解 人 类 的 语 言, 就 必 须 在 这 一 点 上 取 得 进 展, 这 是 一 个 相 当 艰 苦 的 工 作。 此 外, 随 着 硬 件 资 源 的 不 断 发 展, 一 些 核 心 算 法 如 特 征 提 取、 搜 索 算 法 或 者 自 适 应 算 法 将 有 可 能 进 一 步 改 进。 可 以 相 信, 半 导 体 和 软 件 技 术 的 共 同 进 步 将 为 语 音 识 别 技 术 的 基 础 性 工 作 带 来 福 音。
自 适 应 方 面 , 语 音 识 别 技 术 也 有 待 进 一 步 改 进。
目 前, 像 IBM 的 ViaVoice 和 Asiaworks 的 SPK 都 需 要 用 户 在 使 用 前 进 行 几 百 句 话 的 训 练, 以 让 计 算 机 适 应 你 的 声 音 特 征。 这 必 然 限 制 了 语 音 识 别 技 术 的 进 一 步 应 用, 大 量 的 训 练 不 仅 让 用 户 感 到 厌 烦, 而 且 加 大 了 系 统 的 负 担。 并 且, 不 能 指 望 将 来 的 消 费 电 子 应 用 产 品 也 针 对 单 个 消 费 者 进 行 训 练。 因 此, 必 须 在 自 适 应 方 面 有 进 一 步 的 提 高, 做 到 不 受 特 定 人、 口 音 或 者 方 言 的 影 响, 这 实 际 上 也 意 味 着 对 语 言 模 型 的 进 一 步 改 进。 现 实 世 界 的 用 户 类 型 是 多 种 多 样 的, 就 声 音 特 征 来 讲 有 男 音、 女 音 和 童 音 的 区 别, 此 外, 许 多 人 的 发 音 离 标 准 发 音 差 距 甚 远, 这 就 涉 及 到 对 口 音 或 方 言 的 处 理。
文档评论(0)