体验优异的自然序检字图 气象历.doc

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
体验优异的自然序检字图 气象历

体验优异的自然序检字图 陕西省气象局 张时钊 有人说汉字难学,最多也就是查字典难。有些字,我们常读白字,就是因为急忙查不到它,只得读半边,读错了。不像拼音文字,有自然的字典序,任何字汇在任何字典中都有唯一的位置,一定可以快速查到。汉字繁多,字形复杂,一直沿用许慎的部首法,虽经列代修正,还是有不少字,连属于那个部首都定不下来。自从上世纪初叶,王云五创四角号码,开始了新一轮汉字数字化的努力,但直到现在的万“码”奔腾,仍没出现能与全部汉字一一对应的数码体系。 实际上现在的数字化是把不同的汉字置换成唯一的内码。内码与字库里字模是一一对应的。字库则是从印刷文字的铅字库继承来的。在电脑速度还不能实现笔画组字时,这是实现电脑文字的唯一方法。但决不是最好的方法,尤其对字形繁多的汉字和要处理世界所有文字时。因为多大的字库也收不全所有字形,字库需要不断的增订,就难免造成缺字和错乱。采用无字库或小字库的组字技术,外码(输入码)与内码一致了,汉字也有了自然的字典序,同时解决了汉字排序、检索(查字典)和输入法等等问题。自然序汉字字典是这个技术应用的一个方面。 现在的自然序汉字字典,有点像我国著名理论物理学家王竹溪,以其毕生精力完成的五万字的《新部首大字典》。王竹溪的新部首只有56个,加上作为变体的一百个左右的字形,也只有160个。这些新部首实是组成汉字的字根(部件),该字典也是把每个汉字所有字根按笔顺排列构成编码的。因为所取字根数少,很多字根只得拆为单笔画字根(即它的前7个新部首)。这样,据以检字的编码,码长很长,很不直观。我的字典选用600多个字根,但按它们的笔画构成特点,分为28个类,每类以一个汉字为代表,称为根母。它们是: 一二三四五十千,东西南北中心线, 广大人民生子女,口目与手山土田。 各个根母的特点描述如下: 1. 一 :以一点开头的字。另外,不属于任何字根之单笔也归此。 2. 二 :连续书写、但相互分离的二个笔画,和以两点开头的字形。 3. 三 :三个分离的笔画,或三点开头的字形,或含“小”“水”等字形,特别包括“州”字。 4. 四 :四个分离笔画,含四点的字形,或似“四”字的字形。 5. 五 :“五”字含笔画“”,其上下为一长横笔。凡有这两个特点之一的属之。 6. 十 :首笔为长横,继有竖笔与之相交成十字形者。 7. 千 :“千”字开头的独体字,“采”“乎”及“礻”“衤”亦属之。 8. 东 :含木(朩)字形。车(車)虽没有木字形,因与东(東)相像而归之。 9. 西 :以顶横开始,下面却不以一横结束,虽含笔画“”,也不属于“五”。 10. 南 :含字形“冂”或周字框。 11. 北 :左右对称,或以竖笔开头 12. 中 :含“中”字形,以及“斲”字左上部、“繩”字右上部字形的。 13. 心 :含笔画“乚”“乙”等右弯钩笔画的,都属之。 14. 线 :含“幺”首笔(即向左下的锐角)及“弋”的未笔(即笔画捺钩)。 15. 广 :右下和右上包围字根,如“厂广疒卢辶”等。 16. 大 :含大字形 17. 人 :以“人”“入”字开头,及偏旁“亻”“彳”。 18. 民 :含笔画右挑的字根,另外,“牙”字也包括其中。 19. 生 :以笔画“”开头的字根,或如“斤”“段”那样以撇和竖开头的字根。 20. 子 :含笔画“乛”,以及部首“阝”“卩”。 21. 女 :含两斜笔相交的字根。 22. 口 :含口字形的字根。 23. 目 :含日或目字形的字根。 24. 与 :含“弓”未笔、“乃”首笔、“犭”次笔的字根,包括“丏”(因与“丐”相似)。 25. 手 :含三横,首横可为撇,以及部首“扌”“才”以及“寸”。 26. 山 :含字形“彐”“匸”“凵”的字根。 27. 土 :含“土”字形或含两横的字形。 28. 田 :含“田”字形的都属之。 实际上只按汉字组成的根母串来排序,对于查字来说也可以了。只是一个根母类会包含好几个熟知的部首,结果会把原来同部首的字被混到一起了。所以第一个字根还是要按它在根母内的次序来排。28个根母不难由背上面的口诀来记住,但记600个字根的次序就十分困难了。另外,虽然在汉字拆分为字根时,规定笔画交错的都不拆分,但笔画分离的和有连接的,就没有可遵循的简单规则,只要求拆成字根表中列有的。就因为这两点,需要反复查看字根表。为此设计了如下面的检字图。此图连续两页,每页都分6栏,各栏左边的黑体字,就是按次序列出的字根表,而且,字根有变体的,全部都列出。注意,有简繁对应的偏旁,是列为同一字根的不同变体的,这样就可以把对应的简繁两个汉字排在一起。而各栏右边,即每个满行的右端字符,则是字典正文所有页的第一个字头,其左是正文页码和根母码。根母码最长只列首4个,太长,该图就要超出2页了,实际上4个也已够用。我们前面说过,第一个码

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档