汉语语音合成中多音字的处理.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语语音合成中多音字的处理

维普资讯 中 文 信 息 ChineseInformationProcessing 1991年第 l勰 汉语语音合成中多音字的处理 萄大举 罗万伯 贺德珏 杨家沅 徐群英 (四川大学) (成 都发动机公司) 摘要 木上从 自然语言理梢的角度 出发,研究处理汉语多音宇的舍成n口题,着重讨论 了多音 字数据库的数隔结构和查找策略. 关键词 语音合成。多音字,语言 解 。 汉语中多音字 (Polyp~onc)的使用,屡见不鲜.汉字难滨,多音问题是其中一难. 汉语有多少个多音字 由于汉语的发展、变化,很难精确统计. 《汉语大字典》共收字 5 ]了多个 .也括 占字 、生俳字 通假亨在 .多音字比倒是辅 当高的.参考文献 【1】收字约 1 万。其中1干多字为多音字.国家标准 GB2312-80信息交换用汉字编码字符集 (基本集)’收 汉字 6763个 (包括偏旁部首).其中830多个多音字 。约占八分之一。 然if『『, r多音字的凄音,在语言规范化及上E确表达话意 中有重 作用.多音字的正确 合成发音,是一个虽难于处理忸必须止确处理的问题。 本文讨论多音字特点和处理技术。从实际山发,为简化系统和方便处理.除特别指明者 外,均限于现代汉语普通话,处理字符集为国标GB2312-80字符集. 一 、 多音字的特点和汉语语音合成的多级处理 汉语多音字有下述特点: 1.多音字个数多..在常用一二级汉字中,多音字比例高达八分之一. 2.使用频度高.文献口0附录4所列 汉“字频度排序表 .综合统计的前十个高频字中.。的 , “一 ’ 、 了 、不 ,和’、大 等 /个都是多音字.即使除去 一 和 不’两个 变“调 多音字外,也 还有 四个. 3.多音彳多为两个不 同的读音 。但 电有柏 当多的多音字,异音个数超过 2.如。|阿’字。 包括音变和异体字.多达 l2个音[J1, 4.多音宁构词变化大。有时难于认凄出正确的读音 .有的多音字 儿 拘成一字词。大多 数构成二、三字词。部分构成四字词,等等.有的既组词,又作为姓 氏等专有名词使用.或 不杓诃,只作曲姓 氏使用.显然,姓 氏很难构成常规意义下的诃。 5.多音卞异音的使用频度变化大.不少多音字。几个异音。都是常读音。也有的多音 字,以一、二个音为主,其余音组诃很少。或只在地名等专有名词中使用。 6.有 的多音字的某些异音是由变调 (modulation】、轻化 (1ightening)等音变 (Phonetic variation)产生的.尽管音变现象遵循一定的语音规律和习惯 。但由于音变现象包括音素的变 国家 自然科学基金资助瑚 H 一 33— 维普资讯 中 文 信 息 Chineseln~brmatiorlProcessing I991年第 l期 化 卢调的变化和音长的变化, 口.寄I玎K帧Jr下史,更令人捉摸不j . 人工 自然语言合成 的rt的,足 川人丁 ,合成流利, 自然 口r懂度高的语音 。为了 达到此 I:t的,从汉语文奉剜汉语音合成中 必 妊理好语调 (intonation.亦称句调)和多音 字的止确凄音等。 语调的 奋比较复杂,一般说米,主 包括亚音,挣 和语气升降儿方面。多音字的处 理内容,丰H刘磐 纯些.但多音宁处理的 1【衅 从 r逆多音宁持点 已可看 山一斑 。 从连续语音合成 出发 ,婴求从汉语义奉 中止蛹}玎刮 出意群 标注 1应8勺音 【声母 、韵 母 字调)、语感重音 重【读)和埋辑重音 (强媚)、语气等。很显然,且 有语言理解后 ,才 能完成上述 求。 从文木 出发的汉{吾{吾音合成多级处理过程也括: 1舭f3陀。主要是

文档评论(0)

juhui05 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档