《OCR联机手写汉字识别.docVIP

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《OCR联机手写汉字识别

2 联机手写汉字识别——笔输入——笔输入 2.1 什么是笔输入——从键盘输入说起 笔(式)输入也叫做手写输入。它的用途是在一块跟计算机连接的书写板上写字,即时把字符输入计算机。必须指出的是,笔输入的作用不只是输入字符的图形,还要据此对该字符加以识别,并用机内代码来表示,以便于对输入的文字作进一步处理。 电子计算机是西方发明的,用键盘来打印拼音文字在西方已有很长的历史,因此采用键盘向计算机输入拼音文字和标点符号是很自然的事,把字母等符号变换为便于计算机处理的编码也不困难。1838年美国人莫尔斯就已发明用点和划两种符号来表示英文字母,用来传送电报信号,使电报机进入实用阶段。1844年美国建成从华盛顿到巴尔的摩全程64公里的电报线路,揭开了人类通信新的一页。这种莫尔斯电码现在还在通信领域(如无线电报)广泛应用。计算机用的内码虽然和莫尔斯电码有所不同,但原理上是一样的,只不过采用位数固定的(0,1)码来表示各个字母而已。因此,采用通常的QWERTY键盘、配以适当软件,就可以把拼音字母以编码的形式直接输入计算机,不需对输入信息再加以识别。当然,如果输入的是写在(或印在)纸上的拼音字母或符号,那就和输入其他手写文字一样,也需要用识别软件进行识别,否则计算机也不可能“懂得”这种手写字母、符号所代表的信息。 方块汉字和拼音字母完全不同,如何把汉字输入计算机呢? 20世纪70年代以前,我国曾仿照西文打字机的式样,研制几种用于打印汉字的大键盘打字机。这种汉字打字机采用一字一“敲”的汉字键盘。键盘的盘面安放着1000多个铅字,盘面上还有两根可分别在水平与垂直两个方向移动的杠杆。移动杠杆使打字用的卡具对准某个汉字,然后敲击按键,就可以把该字打印在纸上。由于汉字字量很大,使得键盘体积不可能太小,机械结构也不简单,操作相当不便。更突出的问题是:打字员还必须熟记每个汉字的位置,否则不但不能提高打印速度,甚至无法工作。此外,大键盘的盘面/PGN0023.TXT/PGN虽然很大,但一般也只能容纳1000多个铅字,仅占常用汉字的一半左右(国标GB 2312-80汉字基本集第一级的字数为3755个)。打字员打字时往往由于字盘上没有所需的铅字而不得不开个“天窗”,留个空格。这样的汉字字盘,很难满足实际应用的需要。 几十年来我国科技人员为了改善汉字打印工具做了大量极其艰苦但富有成果的研究工作。主要成果之一就是改造原用于西文打字的标准QWERTY打字机,使其能用于打印方块汉字。最早投入市场并广泛在我国应用的是王永民发明的五笔编码(即所谓王码)。这种键入方法所采用的是标准键盘,体积大大缩小,打字时不像大键盘那样一字一键,一般需击键数次才能打入一个汉字。但是打字人员如果熟练记住各个汉字的“编码”,就可以“盲打”,使打字速度大大提高。80年代以后,我国经常举行全国性的汉字打字竞赛,速度最快的专业打字人员每分钟可以打入250个汉字左右,相当于、甚至略高于西文打字的速度;一般非专业人员的打字速度也可以达每分钟几十个汉字,基本上满足实际应用的需要。五笔画王码键入方法的成功,不但初步解决了把汉字输入计算机的“瓶颈”问题,对文字工作者也是极大的鼓舞。近二三十年来,不少科技工作者为了改进汉字键入方法,提出了各式各样的编码,如王码、郑码、钱码、肖码、自然码、码根码等等。据估计,80年代的10年间,几乎每个月都有两三种汉字输入码问世,汉字编码输入法总计已有数百种之多,形成一派万“码”奔腾的壮观景象。 但是,近一两年来,这种万“码”奔腾的火爆局面悄然退/PGN0024.TXT/PGN潮。1999年2月1日《北京科技报》在“热门话题”栏目中,以“万码为何齐喑”的头条标题,报导了“曾经辉煌一时,突破我国汉字输入瓶颈的码型输入法在新技术浪潮下被淘汰出局”的消息。该文作者用“淘汰出局”来描述汉字键入方法在汉字输入领域的处境,并不恰当。键入方法在实际上还很有用武之地,例如一般的办公室今后仍会采用打字机,因为在办公桌上用打字机打字毕竟也很方便,而且也已适合许多人、特别是西方人的习惯。不过在有些场合,例如在室外工作,用打字机输入字符就很不方便,也不符合计算机小型化的潮流。小型计算机,如已有的个人数字助理PDA (personal digital assistant)或正在发展中的掌上电脑,其尺寸比常用的键盘小得多。目前的键盘不可能和掌上电脑等小型化计算工具配合使用;把键盘缩小也不是办法,因为人的手指不可能为适应键盘小型化而变小。寻找新的输入方法是科学技术发展的必然趋势和要求。笔输入和语音输入等更先进的方法就是在这种情况下随着科学技术的迅速发展应运而生的。 那么,人们能否像平时用笔写字那样,把手写字输入计算机?计算机又是怎样识别手写的文字呢?下面

文档评论(0)

1789811832 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档