汉字字形的网格规整化处理关键步骤.docVIP

汉字字形的网格规整化处理关键步骤.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉字字形的网格规整化处理关键步骤   摘要:建立汉字字形网格模型具有重要意义。本文主要介绍汉字字形网格模型的建立步骤和涉及到的算法。   关键词:网格模型;规整化处理;手写汉字   中图分类号:TP391文献标识码:A文章编号:1007-9599 (2011) 05-0000-01   Grid Structured Treatment Key Steps of Chinese Characters   Zheng Jun   (InnerMongolia Baotou Teachers College,Information Science and Technology Institute,Baotou014030,China)   Abstract:Grid model of Chinese characters established is very important.This paper introduces the Chinese characters grid model established steps and the involved algorithms.   Keywords:Grid model;Structured treatment;Handwritten Chinese   一、引言   汉字造型、汉字结构等形状信息是汉字的表现形式,通过这些形状信息我们可以区分出不同的汉字。汉字字形特征比对计算,汉字字形结构进行统计分析[1]是汉字进行信息化处理的基础。而这些方面的处理都需要把汉字规范到统一的模型下。本文针对这一问题,主要介绍对使用鼠标手工输入的汉字字形进行规整处理的步骤与方法。   二、网格规整处理的实现步骤   (一)手写字形大小的网格规整处理   通过鼠标输入的手写汉字字形,其大小是不统一的。这个步骤就是要统一输入的汉字到合适大小,为后面的处理做准备。经过这一步骤的处理,可以得到一个大小与位置合适的手写汉字字形。   (二)单笔画的起止特征信息的提取   这里所指的笔画是指使用鼠标描绘汉字时从按下鼠标到松开鼠标其间所绘制出的一条曲线。单个笔画信息主要有:端点位置信息、笔画方向信息、笔画长度信息。   (三)笔画之间关联信息的检测和识别   使用鼠标手工输入汉字的各个笔画之间不是孤立的,各笔画之间有位置关系。汉字笔画之间的位置关系是汉字的一个特征,直接影响到汉字的呈现效果,这些位置关系对于准确区分汉字是非常重要的。对汉字字形笔画之间关联信息的检测和识别,主要是要检测和识别出连接点和滑动点。连接点是指:两个不同笔画之间的端点的距离特别小,在网格规整后,这两个点必须要连接在一起的点。滑动点是指:一条笔画的某个端点到另一条笔画中部的距离特别小,在网格规整后,必须仍然要保持这样的位置关系。例如:“刀”与“力”这两个字如果不能很好地处理“丿”与“?S”的位置关系,就不能准确的定义这两个汉字。“刀”字中“丿”与“?S”的位置关系是滑动点的位置关系。   (四)简单笔画和复杂笔画的识别及处理   简单笔画是指只需要用起点和终点两个点就可以描述的笔画。复杂笔画是指只除了使用起点和终点,还需要用起点和终点之间的其它点才能描述的笔画。利用Douglas―Peucker算法[2]对笔画提取特征点可以区分这两种笔画。这种算法的基本思路是:对每一条曲线的首末两点虚连一条直线,求其间所有点到直线的距离,并找到最大距离值dmax,用dmax与限差D相比:   若dmax=D,保留dmax对应的坐标点,并以该点为界把曲线分为两部分,对这两部分重复使用这种方法。   (五)笔画方向的网格规整处理   在网格线中每条网格线都有固定的方向,其情况是可以列举出的。要想把手写汉字笔画规整到网格线上,首先就必须把手写汉字的方向映射成网格线的方向。这里采用正弦与余弦定理来解决这个问题。在简单笔画数组中拿出一条简单笔画,取出这条笔画的正弦值sin与余弦值cos,如果cos的绝对值小于等于10-3,那么就把方向值规整成这样的值:cos=0,sin=sin/|sin|;如果cos的绝对值大于10-3那么进行下面的规整处理:   通过公式|sin/cos|求出正切值tan,如果tan1/4,那么方向规整的结果是:sin=0,cos=cos/|cos|;如果1/4=tan3/4,那么方向规整的结果是:sin=(sin/|sin|)*0.5/(0.52+12)1/2,cos=(cos/|cos|)*1/(0.52+12)1/2;如果3/4=tan4/3,那么方向规整的结果是:sin=(sin/|sin|)*1/(12+12)1/2,cos=(cos/|cos|)*1/(12+12)1/2;如果4/3=t

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档