对汉字笔画若干数据的统计与应用要点详解.doc

对汉字笔画若干数据的统计与应用要点详解.doc

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
目 录 第一章 绪论 2 1.1 研究背景及意义 2 1.2 研究对汉字笔画若干数据统计的难点 2 1.2.1 汉字字量大 2 1.2.2 字形相似、结构复杂 2 1.2.3 笔顺不唯一 2 1.3 论文的工作 3 第二章 汉字笔画的相关概述 4 2.1 笔画特征 4 2.2 笔画顺序 4 2.3 笔画输入法 4 2.4 笔画的分类 4 2.5 本章小结 5 第三章 对汉字笔画若干数据的统计 6 3.1 汉字概述 6 3.2 汉字使用频度 6 3.3 统计原始数据来源 6 3.4 汉字笔画统计的意义 6 3.5 汉字笔画统计的准备工作 6 3.5.1 表合二为一 6 3.5.2 按照编码进行排序 6 3.6 汉字的各种平均笔画数的统计 7 3.6.1 汉字的算术平均笔画数 7 3.6.2 按使用频度加权的平均笔画数 7 3.6.3 能与其它汉字区分开的前若干笔画的算术平均数 8 3.6.4 能与其它汉字区分开的前若干笔画的加权平均数 8 3.7 汉字笔画的其他数据信息的统计 9 3.7.1 以各种笔画起笔的汉字的数目 9 3.7.2 各种笔画在6763个汉字中出现的频度 10 3.7.3 笔画相同的汉字 11 3.7.4 对连笔的数据统计 11 3.8 本章小结 12 第四章 统计汉字笔画若干数据的应用 13 4.1 在基于笔画的汉字输入法上的应用 13 4.2 在汉字的联机手写识别系统上的应用 13 4.3 本章小结 13 结论 14 参考文献 14 附录: 15 对汉字笔画若干数据的统计与应用 项 衍,数学计算机科学学院 摘 要:汉字是中华民族迄今为止连续使用时间最长的主要文字,也是上古时期各大文字体系中唯一传承至今的文字。古老而复杂多样的汉字属于二维平面的方块字,由笔画构成。要研究并实现基于笔画的汉字输入法和汉字的联机手写识别系统,必须建立在对汉字笔画信息的各种数据的统计的基础之上。很显然,这些统计数据是实现基于笔画的汉字输入法和汉字的联机手写识别系统的前提,具有重要的指导意义。本文着眼于对汉字笔画的若干数据进行统计并且研究其应用,这些数据主要包括:汉字的算术平均笔画数、按使用频度加权的平均笔画数、能与其它汉字区分开的前若干笔画的算术平均数、能与其它汉字区分开的前若干笔画的加权平均数、以各种笔画起笔的汉字的数目、各种笔画在二级字库的6763个汉字中出现的频度、统计笔画相同的汉字、统计连笔(即邻笔)频度等。 关键词:汉字;笔画;使用频度; Statistics and Application on Some Chinese Character Stroke Xiang Yan,College of Mathematics and Computer Science Abstract:Chinese characters are the main text and the longest continuous utility which the Chinese nation used so far, and are also the only characters heritage from the major writing systems of ancient times.Ancient,complex and diverse characters are two-dimensional plane, which are constituted by the strokes. To study and achieve the strokes of Chinese character input method and Chinese characters online handwriting recognition system, we must on the basis of statistical data information of Chinese character strokes. And obviously, these statistics have important guiding significance only based on the premise of the strokes of the Chinese character input method and the Chinese characters online handwriting recognition system. This article with an eye to the statistical data of the number of strokes of Chinese characters and stud

文档评论(0)

三沙市的姑娘 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档