智能信息处理文字识别联机识别and脱机识别.pptVIP

下载本文档

0
0
约2.97千字
约 10页
2025-02-22 发布于北京
举报
版权申诉

智能信息处理文字识别联机识别and脱机识别.ppt

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

字符的分割01对于输入的二值化文字图像，首先要逐行地把各文字行图像切割出来，行切割的方法是：对二值化图像从上到下逐行扫描并同时计算每个扫描行的像素，以获取图像的水平投影，根据水平投影值确定文字行的位置，利用文字行间空白间隔造成的水平投影空白间隙，即可将各行文字分割出来行切割02字切割是从行切割后得到的文字图像中将单个汉字的图像分割出来。基本方法是利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隙将单个汉字的图像切割开来。汉字的构造决定了字切割是更为困难的字切割Backgroundprovidedbym62Visualcommunications,visitBackgroundprovidedbym62Visualcommunications,visit智能信息处理第3章文字识别技术张宝健3.1文字识别系统3.2脱机文字识别3.3联机文字识别3.1文字识别系统主要介绍模式识别中的文字识别的原理对分类器的具体实现做了详细剖析列举常见的文字识别方法对于文字识别的前景与挑战的分析文字是人类相互交流信息的重要工具。01社会发展进入信息时代，人们已经不再停留在自己的耳朵和眼睛去直接获得这些信息，而是使用计算机将文字自动的输入计算机，用计算机对他们进行处理，随时以各种方式满足人们的不同需要。因此，研究如何用计算机自动识别文字图像，解决文字自动输入计算机，并进行高速加工处理的问题已引起大家的关注。02根据识别对象的不同，文字识别可分为西文识别、数字识别和汉字识别等。这些字符可以是手写体和印刷体，因此文字识别又可分为手写体文字识别和印刷体文字识别。根据采用的输入设备不同，文字识别可分为联机识别和脱机识别。通俗的说，文字识别就是由计算机自动识别各种字符，如字母、数字、汉字或其他语言中的字符。文字识别有如下分类：其中联机识别是指将字符书写在与计算机相连的书写板上，由计算机根据字符的书写轨迹进行实时识别，因此联机识别主要是针对手写体而言的；脱机识别是指将字符书写或打印在纸张上，用扫描仪或其他光电转换装置将其转换成电信号输入到计算机中，再由机器进行识别。因此，脱机识别又称为光学文字识别，即我们通常所说的OCR（OpticalCharacterRecognition）。限制性（Constrainted）和非限制性（Unconstrained）手写体字符识别（或称自由手写体字符识别）。无论是联机还是脱机手写体字符识别，都经历了一个由限制性识别到非限制性识别的过程。目前，人类所使用的各种文字，绝大多数都只包含很小的字符集。如英文字符集由26个字母组成，俄文由32个字母组成，这些字母及其变化的不同组合构成了具有不同含义的文字，是这类文字的基本组成部分。对于小类别数的字符集，如阿拉伯数字，手写体识别已经可以做到对书写者不加任何限制。但对于大类别数的字符集，如汉字，还必须对书写者施加某些限制，以保证较高的识别率。未来随着技术的发展，将逐步放松限制，最终可以达到最自由手写体文本的识别。文字识别系统的原理及组成文字识别属于模式识别的范畴，模式这个概念的内涵是很丰富的。“我们把凡是人类能用其感官直接或间接接受的外界信息都称为模式”。比如：文字、图片、景物、声音、语言等；模式识别的目的就是要研究出能自动进行模式分类和描述的机器系统，以完成人类的模式识别的功能。一个模式识别主要分为四个组成部分，其框图如下：数据获取：输入模式转换成适合于机器处理的形式的过程。预处理的目的是去除噪声，加强有用的信息，对由输入设备或其他因素造成的退化现象进行复原，以利于特征提取经过预处理后的数据维数很高，为了有效地实现分类识别，需要对原始数据进行变换，得到最能反映原始模式本质的特征向量。把原始数据组成的空间叫做测量空间，把分类识别赖以进行的空间叫做特征空间。通过变换可以把在维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式，这就是特征的提取和选择。分类决策是在特征空间中用所设计的分类器把被识别对象归为某一类别。模式识别的过程具体化到文字识别系统中，则分为下面的几个过程：光电变换检测部分的主要功能，是对纸面上的文字进行光电转换，然后经模数转换成具有一定灰度的数字信号，送往其后的各部分进行处理和识别。01常用的检测设备是扫描仪，摄像头等。02灰度：灰度使用黑色调表示物体。每个灰度对象都具有从0%（白色）到100%（黑色）的亮度值。03文字图像分割的目的就是根据文字图像的特征实现文字图像区域的定位和分割，将真正的文字图形分割出来，以便后续进行识别。01识别预处理部分的功能是将已分割出的文字图形信息加以区分，去除信号中的污点、空白等噪声，增强