55文字信息处理.ppt

  1. 1、本文档共79页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3、汉字字形码 (3)曲线字形——曲线轮廓描述法 一、贝塞尔( Bezier)曲线 6、Bezier曲线的缺点 缺点: 所生成的曲线与特征多边形的外形相距较远 局部控制能力弱,改变任何一个控制点的位置,就可改变整个曲线形状 控制顶点数增多时,生成曲线的阶数也增高 控制顶点数较多时,多边形对曲线的控制能力减弱 曲线拼接需要附加条件,不太灵活 用三次Bezier曲线描述的文字曲线轮廓 3、汉字字形码 (3)曲线字形——曲线轮廓描述法 二、B样条曲线    B样条曲线采用了不同于Bezier曲线的基函数,具有Bezier曲线的优点,克服了Bezier曲线的缺点。 优于Bezier曲线之处: 与控制多边形的外形更接近 局部修改能力,局部修改不会改变整体形状 控制点数不再与曲线的次数相关,计算简便。 3、汉字字形码 (4)数字式字库技术 基本要素: 字形轮廓描述 字符编码映射(地址码) 提示信息(Hint) 其他信息:名称、版权、版本等。 Postscript字库: 三次Bezier曲线 TrueType字库:二次B样条曲线 第五章 图像数字化原理  一、汉字代码体系 4、汉字地址码  第五节 文字信息处理 汉字地址码 汉字字形码 汉字字库 第五章 图像数字化原理  一、汉字代码体系 5、汉字代码的转换  第五节 文字信息处理    在文字信息处理过程中,在不同的阶段有不同的编码,需要汉字代码转换。 用户 键盘管理模块 汉字处理模块 显示管理模块 打印管理模块 显示器 打印机 字库管理模块 字库 机内码 输入码 机内码 机内码 字形码 字形码 字形码 机内码 字形码 地址码 字形码 汉字代码的转换 第五章 图像数字化原理  二、五笔字形汉字编码方案 人们对汉字编码输入方案的要求: 易学性 易于盲打 平均码长短  第五节 文字信息处理 五笔字形的平均码长:2.6码 1、五笔字形笔画代号  第五节 文字信息处理  二、五笔字形汉字编码方案   笔画:书写汉字时,一次不间断地连续写成的一个线段,叫做汉字的笔画。 ??? 汉字的笔画,可分为以下五种,命以代号1、2、3、4、5。 ??????????? 1、横:一(“现”字的“王”字旁最下一笔是“提”笔,所以提笔属于横)。 ??????????? 2、竖:丨(旧体的“木”字竖笔带钩,所以竖左钩属于竖)。 ??????????? 3、撇:丿 ??????????? 4、捺:丶(由“村”字的“木”字旁可知,点笔就属于捺)。 ??????????? 5、折:乙(包括一切带拐弯的笔划,都归为折类)  第五节 文字信息处理  二、五笔字形汉字编码方案 2、五笔字形字根 字根:   由若干笔画交叉连接而形成相对不变的结构。   汉字由字根组成,字根由笔画构成。笔画、字根、整字是汉字结构的三个层次。   五笔字形的字根没有公认的标准和数量,汉字中的边旁部首,有的是字根,有的可组成多个字根,有的是单字作为字根(羽,竹),五笔字形方案中,把组字能力强,在日常汉语文字中出现频率高的结构,作为基本字根。共计130多个字根。  第五节 文字信息处理  二、五笔字形汉字编码方案 3、五笔字形字根表 五笔字型的字根键盘 ???  五笔字型根据字根的笔画(横、竖、撇、捺、折五种)、字根组字的频率,以及英文字母键的排列位置,将130个基本字根分为五类,分别对应键盘上的五个区(区号),每个区又分为五个位(位号),区号(十位)加上位号(个位)即为键盘的区位码,分别对应于字母键A~Y。这样共得到:11~15、21~25、31~35、41~45、51~55共25个键位。  第五节 文字信息处理  二、五笔字形汉字编码方案 3、五笔字形字根表  第五节 文字信息处理  二、五笔字形汉字编码方案 3、五笔字形字根表  第五节 文字信息处理  二、五笔字形汉字编码方案 3、五笔字形字根表 成字字根:   基本字根中有些字根本身就是一个完整的汉字,例如:日月人火手等,这种字根在五笔字型里叫做成字字根。  第五节 文字信息处理  二、五笔字形汉字编码方案 3、五笔字形字根表 键名字根:   在同一个键位上的几个基本字根中,选择一个具有代表性的字根,称为键名字根。五笔编码键盘图中各个键位左上角的字根就是键名字根。  第五节 文字信息处理  二、五笔字形汉字编码方案 4、五笔字形字根表分布规律 (1)首笔决定区号,次笔决定位号。 如:王:在1区1位(G键),第一笔是横(1区),第二笔是横(1位)。? ??????? 白:在3区2位(R键),第一笔是撇(3区),第二笔是竖(2位)。 ??????? 石:在1区3位(D键),第一笔是横(1区),第二笔是撇(3位)。 ??????? 文:在4区1位(Y键),第一笔是点(捺)(4区),第二笔是横(1位)。

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档