- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【2017年整理】基于几何结构特征的印刷体数字识别方法
基于几何结构特征的印刷体数字识别
车生兵 金 帅 李小立
(1.中南林业科技大学计算机与信息工程学院,湖南 长沙 410004)
摘要:通过分析印刷体数字的几何结构特征,提出了一种基于几何结构特征的印刷体数字识别算法。读取单个二值化数字图像后,确定该数字图像的字体边界,然后根据其结构抽取出数字中能够唯一标识该数字的特征,并对所得到的数字特征值进行分析,以确保每一个提取的数字特征都较之其他数字不相同。然后基于这些特征对10个数字进行分类识别。通过实验仿真,说明该算法是有效可行的。
关键词 特征提取;唯一性;特征值验证
Recognition of Printed Figures Based on Geometric Structure
Jin Shuai, Li Xiaoli
College of computer science Central South University of Forestry Technology Hunan Changsha 410004, China
Abstract A feature extraction method based on the geometric properties of printed numerals was descrided. After reading a single binary numerical image, determine the boundary of character on this numerical image. Then according to the structure, the features that can uniquely identify the numbers could be extracted from the printed numerals, and verify the obtained feature values of numbers to ensure that each extracted feature value of number was different from that of others. If the results showed that all the extracted feature values of numbers were not the same, it proved that the feature extraction method was feasible.
Key words Feature extraction; Uniqueness; Verification of feature values
0 引言
随着计算机光学字符识别(OCR)技术的快步发展,人们与数字媒体的关系愈来愈密切,也越来越离不开数字化带来的方便和快捷。印刷体数字识别是字符识别的一个分支,在很多方面都有应用,如汽车车牌自动识别、支票、超市收银和有关印刷体编号等等。这些方面都与人们息息相关,所以识别的效率至关重要。
单以识别率而言,特征抽取可说是OCR的核心,用什么特征、怎么抽取,直接影响识别的好坏。而特征可说是识别的筹码,简易的区分可分为两类:一为基于统计的特征,如数字区域内的黑/白点数比,当数字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就足以应付了;而另一类特征为结构的特征,如数字影像细线化后,取得数字的笔划端点、几何轮廓及结构,在识别过程中有效结合这些几何和结构特征,可以得到可靠性较高的识别结果[1]。
分析印刷体数字的各种识别算法[2~5],本文推出一种基于几何结构特征的印刷体数字识别方法。该方法利用数字本身的几何结构,提取出能够唯一标识自己本身的特征,作为自身的识别编码。基于这些特征,就能对10个数字进行分类识别。
1 特征描述
根据印刷体数字的几何结构特征,本文提取数字的4个特征分别为:
(1). 二值化后的数字上1/3处水平扫描时0、1变换的次数;
(2). 二值化后的数字下1/3处水平扫描时0、1变换的次数;
(3). 以二值化后的数字横向1/2处为分界线,对下半部分水平扫描时0、1变换的最大次数;
(4). 二值化后的数字垂直扫描时0、1变换的最大次数。
下面以数字“0”为例对4个数字特征进行说明,如图1所示。箭头方向表示数字的扫描方向。在特征提取过程前,定义变换次数统计变量count,初始为0。定义标记flag1、flag2,初始值为1,即为白色点。flag1表示记录的前一个像素值;flag2表示扫描到的当前像素值。定义最大变换次数变量max,初始值为0。在统计每个特征值前,都要将变量count、flag1
您可能关注的文档
- 【2017年整理】基于MATLAB通信系统的设计仿真.doc
- 【2017年整理】基于MCS-51单片机的步进电机系统.doc
- 【2017年整理】基于mcgs变电站监控.doc
- 【2017年整理】基于FPGA的高速IIR数字滤波器设计与实现.doc
- 【2017年整理】基于PASCO系统的混沌摆实验的研究.doc
- 【2017年整理】基于PLC控制的锅炉自动输煤系统设计.doc
- 【2017年整理】基于PIC单片机的太阳能发电系统设计.doc
- 【2017年整理】基于multisim的低频电子线路实验.doc
- 【2017年整理】基于MSP430的数字电压表设计.doc
- 【2017年整理】基于PLC的多级传送带控制系统.doc
文档评论(0)