对未来中文信息处理拼音文字性编码方案初步设计.pdfVIP

对未来中文信息处理拼音文字性编码方案初步设计.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 9 卷第 4 期 西安文理学院学报 : 自然科学版 Vol. 9  No. 4 2006 年 10 月 Journal of Xi ’an University of Arts Science (Nat Sci Ed) Oct . 2006 ( ) 文章编号 2006 对未来中文信息处理拼音文字性 编码方案的初步设计 黄炳羽 (广西合浦县 政府办公室 ,广西 合浦  536100) 摘  要 : 以汉语拼音方案为基础,借鉴早期国语罗马字拼音法式的优缺点 ,创造性地设计了一种全 新的汉语拼音文字性编码方案. 该方案在拼写法上实行声调和韵母合一拼写 ,即用一个特定的字母组合 同时表示特定的声调和韵母 ,拼写法简短 ,规则高度简单 ,对同音不同调汉字的各种拼写法相互之间一 律前同后异 ,非常利于思维、运用和记忆. 同时 ,主张适当地精简同音汉字 ,并对汉字进行部首规范提出 了独到的建议. 关键词 : 中文信息处理;汉语拼音文字性编码 ;声调韵母合一拼写 中图分类号: H125. 1      文献标识码 :A 计算机和网络中文信息处理设计以国家汉语拼音方案为基础的音码在理论上比形码更有前途. 但 是 ,对于国家汉语拼音方案 ,如果去掉字母上的标调符号则不仅使得读音难以准确 ,而且还会造成数以 万计的原本异音异形的异义词的形体混同. 国家拼音方案的26 个标准英文字母加上 ü、ê和带标调符号 的29 个变体字母 ,实际所用字母共计多达 55 个. 国家汉语拼音方案根本不能作为汉语拼音文字方案. 同时 ,世界各种语言对拉丁字母具体表示的音值也各有各的不同. 有的字母音值比较稳定 ,有的字母则 ( ) 在不同语言中音值不同 通常是不常用的那几个字母j qwxyz ,还有 v . 面对 26 个字母不够用的情况 ,为 了表示各种音位 ,完全可以使用字母组合或者附加符号. 英语字母组合多 ,无附加符号 ;法语、德语、西班 牙语、葡萄牙语、意大利语、匈牙利语、越南语都既采用字母组合 ,也采用附加符号. 总之 ,使用字母组合 表示不同的音值不仅不是一件特别的事 ,而且还是一件非常经济有效和科学简便的重要举措. 在去掉附 加符号时不致于造成异音异形词之形体混同的前提下 ,使用附加符号也是经济有效、简便可行的. 本编码方案充分利用 26 个国际通用的英文字母及其各种组合这样的无价资源 ,设计了新型的拼写 和编码规则 ,用字母标调 , 以确保拼写法和编码既高度简短又非常规范. 1  设计汉语拼音文字性编码的基本原则 ( 1) 以现行国家汉语拼音方案为基础的原则. (2) 遵循拉丁化拼音文字的基本规则的原则. (3) 声韵 ( 母介音不重叠原则. 声母j[ ji ] 、q[ qi ] 、x[ xi ] 、y[i ] 不能作含有介音[i ] 的韵母的声母 方括号[ ] 内为国家标 ) ( ) 准汉语拼音 ,下同 . 4 信息高度集中原则 ,又称拼写法所用字母最少原则. 拼写每个汉字所用字符数 ( ) ( ) 含义符 不宜超过 4 个 , 声母为 ch 、sh 的最多可用 5 个 . 如果拼写法字母排列太长 ,所带信息过于分 散 ,与汉字和中国文化注重精简浓缩存在强烈反差 ,就不符合视觉和文字心理学的要求. (5) 韵母必须有 元音字母和韵母整体认读原则. 本汉语拼音文字性编码规定的元音字母有七个 :a 、e 、i 、o 、u 、y 、w. 其中 ,y 收稿日期 :2006 - 07 - 20 ( )

文档评论(0)

kehan123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档