转换规则和特征转换机制.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
会议论文,完美pdf格式,欢迎下载!

转换规则和特征转换机制 余国桥 摘 要: 盘式输入中,定义在字符键上的东西是转换规则不是其他,是联 系码元与代符以及元素与代码的纽带,应当采用特征转换机制。一条转换规则确 定哪一种类别的码元与哪一个二进制八位数据进行相互转换。 关键词:盘式输入 特征 转换 规则 机制 盘式输入中,放在字符键上的那些东西的本质不能认识清楚、明白,中文盘 式输入及其输入法只能陷于说不清、道不明、理还乱的困惑中,只能在你选这些 我选那些汉字编码码元中徘徊。 英文盘式输入中,定义在26个字母键上的26个大写字母不是字母,不是码 元或编码码元,而是 26 条转换规则。读音的特征和形体的特征以及大小写为形 象化说明和规定的内容,即各条转换规则的内容。一条转换规则服务于一种码元, 对特定的一种码元与特定的一个二进制八位数据进行相互转换。英文的大、小写 各26个字母即52个码元。52个码元据其语音特征分类归并为26种类别的码元, 每种码元均含两样类型的码元。例如 A 键上的“A”是指:读音特征为[ei]的所 有大小写字母或码元A、a与二进制代十进制代码65)进行转换的 规则。凡是输入读音特征为[ei]的所有大小写字母或码元 A、a 都要击 A 键。其 余 25 种字母或码元的转换规则和输入同理。为了区分大、小写需要加击 Shift 键,即加上或减去二进制代码十进制代码 32)。因此,字母键甚至字 符键应当称为转换规则键。 中文盘式输入定义或映射在字符键上的编码码元或部件、基本字根、字元、 笔画以及声、韵母等等,是转换规则不是其他。转换规则是联系码元与代符以及 字、词、句元素与代码的纽带。郑码根区代码的命名规则仅仅命名而已,最终仍 把字根放在字符键上;太极码字元分类的规则又是字元键位的判断方法,但仅停 留在对太极字元分类和规位之处;它们离转换规则的本质认识都还存在差距。事 实上,几十个字符键上放得下几十条转换规则,放不了许许多多的码元。选择汉 字编码码元其实是设计汉字码元和制定转换规则,不然只能输入汉字就不能输入 词语。设计汉字码元和制定转换规则是性质、做法、目的、用途决然不同的事, 223 不能合二为一,不能混为一谈。音码输入法为什么能输入字、词、句,就是把声 母、韵母(或其字母)以及声调不自觉地作为转换规则来使用,把声母、韵母(或 其字母)以及声调不自觉地作为字、词、句及其码元的特征来使用,同时不自觉 地将汉字作为字、词、句的码元来使用。说不自觉地使用,是因为都没有明说和 阐述。 码元具有特征,特征为码元的标志与代表。码元是特征的载体,同分成相同 的种类。特征有形的特征、音的特征、义的特征以及频度等。各属性的特征还分 成若干种类,可单用一种或合用多种属性的特征。单用一种属性的特征如形码和 音码,合用多种属性的特征如形音码和音形码。 一条转换规则确定哪一种类别的码元与哪一个二进制八位数据进行相互转 换。转换规则的条数跟特征的种数、码元的种数、代符的数量以及定义使用字符 键的个数相等;这个数量不应只限定在 26 个字母键中,当然不能超过字符键的 总数。英文盘式输入也用了 48 个字符键(空格键同时也是字符键),中文盘式 输入的规范却明确限定用26个字母键,岂不是咄咄怪事。 至于根据什么相互转换那是机制。这个机制不应是从形取码或据形体取码, 不是形体映射,而是特征转换机制。从形取码或据形体取码,是仿照拼音文字把 汉字看作拼形文字所采取的机制。其实,拼音文字是音素文字,汉字是语素文字 不是拼形文字;但都是图形,都是通过点阵字模并转化为二进制数据在计算机中 存储和运行。英文输入的码元是现成的字母,个数少,特征纯,易分类,好设计, 而且词、句都能很方便容易地分出码元或字母。中文输入的码元须要设计,而且 数量多、特征杂、种类繁,设计难,尤其是码元设计不好或未设计时,字、词、 句拆分码元很难。音素文字盘式输入都采用特征转换机制,何况汉字,何况汉语。 许多形码输入法把编码码元映射在字符键上,采用从形取码的机制,这样要想设 计出科学、规范、合理的输入方案,事实证明不可能。 中文盘式输入应当采用特征转换机制。在一个元素或码元中,可提取一种属 性的特征,也可提取多种属性的特征;提取同一种属性的特征时,可提取一样或 几样不同类型的特征

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档