基于K―means图像文字识别与提取研究.docVIP

下载本文档

24
0
约2.63千字
约 7页
2018-08-28 发布于福建
举报
版权申诉

基于K―means图像文字识别与提取研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于K―means图像文字识别与提取研究

基于K―means图像文字识别与提取研究　　摘要 K-means聚类算法作为最常用的集合元素划分算法，在数字图像文字定位、提取与识别中有着广泛的应用。文中针对当前图像文字识别与提取的最新发展状况，提出一种基于K-means的图像文字识别与提取算法。经过上机测试，该算法能够有效提高图像文字识别与提取的准确率与执行效率。　　【关键词】K-means 图像文字提取文字识别 OCR 　　1 引言　　K-means聚类算法是当前常用的基于划分的分类算法，能够按照既定标准与要求将集合进行划分。在数字图像文字提取与识别中，可以通过对数字图像进行灰度处理，将文字背景与文字前景用不同的灰度像素来表示，并使用K-means聚类算法进行像素划分，从而将文字从数字图像中提取出来，作为OCR识别的图像输入。　　2 K-means聚类算法基本原理　　K-means聚类算法的基本思想是利用集合元素之间的距离为划分标准，在集合内部按照元素的分布密度的不同将元素划分为不同的子集合。在划分过程中，通过定义元素之间的距离，按照元素到聚类中心之间的距离最小原则将元素进行聚合，从而得到最终的划分结果。主要包括以下几个步骤：（1）根据元素划分的基本要求，从集合元素中随机选择k个元素作为划分结果的中心元素，并针对集合中的每个元素计算其到聚类中心元素的距离大小，并按照最小距离原则把各个元素划分到对应的聚类中心元素集合中；（2）按照划分结果对各个子集合中的元素计算特征均值，并根据计算结果对划分结果进行更新操作；（3）对更新后的子集合元素再次按照第一步中的方法进行聚类操作，从而得到更新后的元素划分结果；（4）按照上述步骤进行循环计算，当两次计算所得到的的聚类中心元素相同时，所得到的划分结果即为聚类结果。　　K-means聚类算法的基本流程比较固定，其本质是在给定集合元素距离计算方法后，不断进行聚类迭代与循环运算对元素进行聚类划分，在应用过程中只需要定义合适的距离计算方法即可将K-means算法转化为软件程序进行上机运行。采用K-means聚类算法的缺陷主要是在选择聚类中心元素时，算法受到样本元素的选择随机性和外部噪声的影响比较显著，如果不进行有效的算法优化则比较容易导致算法陷入局部最优，因此在采用K-means的图像文字提取与识别处理中需要根据图像特征对算法进行改进与优化。　　3 算法流程设计　　3.1 图像预处理　　在本文提出的图像文字处理算法中，对数字图像进行的预处理包括图像灰度转换、二值化处理、文字块定位以及文字边缘检测等：　　（1）图像灰度转换是将彩色图像转化为仅包含像素亮度信息的灰度图，并将数字图像中的背景冗余信息与其他噪声进行去除。数字图像文字提取与识别中的噪声主要是由于外界光照、颜色等因素导致的图像有效信息受到干扰所产生的，因此噪声去除主要采用了滤波方式，包括领域平均滤波法及中位值滤波法等，将数字图像像素中的噪声去除。　　（2）二值化处理是将黑白图像中的背景与前景进行，一般采用灰度像素阈值分离法来进行，包括全局域阈值分离法、局部阈值分离法及动态可变阈值分离法等。由于动态阈值分离法的计算量大、处理效率低、分离效果较差，所以本算法采用局部最优阈值分离法，通过计算图像不同区块中像素的灰度梯度值变化对像素进行分离。　　（3）边缘检测处理将经二值化后的图像进行特征区域划分，通过检测数字图像灰度变化、颜色变化及纹理特征的变化差异，实现文字块与背景的分离。本算法的边缘检测算法中采用了一阶以及二阶微分算子来进行像素灰度导数值的计算，实现不同区域的边缘检测。　　3.2 聚类处理　　经过图像预处理之后即可采用K-means聚类算法进行文字提取。通过对像素进行聚类处理，可从图像中提取到待识别文字目标区块，详细流程包括：　　（1）对数字图像进行像素空间分类，将其划分为N个子簇，并在每个像素簇中随机选择一个像素作为中心点；　　（2）采用欧氏距离作为像素距离的计算方式，计算N个像素簇中各像素点到中心点的距离，并按最小距离原则进行像素聚类，得到N个像素点子集合，记为Pi（n）；　　（3）随机选择像素子集合Pk和Pm，计算集合之间的最近距离，随后将Pk中距离Pm最近的像素点归入Pm集合，并从Pk中删除；　　（4）重新计算经过上一步处理后得到的N个像素子集合的中心点，重复上述过程直到各个像素子集合不再发生变化；　　（5）对N个像素子集合计算灰度均值，并以灰度值作为各个像素子集合的标记，采用局部聚类分类法得到最终的聚类结果。　　3.3 图层选择与优化　　由于图像文字的中心特性，可通过计算图层像素点距离中心区域的距离得到最终选择的图层。在算法中为了提高图层选择的准确度，首先将图层集合按中心距离大小分为两个子集合