基于聚类及融合技术的数字图像文字提取与识别研究.docxVIP

  • 7
  • 0
  • 约2.4千字
  • 约 5页
  • 2021-07-17 发布于山东
  • 举报

基于聚类及融合技术的数字图像文字提取与识别研究.docx

鉴于聚类及交融技术的数字图像文字提取与辨别研究 摘 要 在对目前数字图像与视频文字提取与辨别技术的剖析与考察基础上,提出了一个鉴于聚类和交融的文字辨别与提取算法,算法包括文字地区检测、块增强、块提取与辨别四个模块。与传统算法相比,该算法在彩色数字图像文字提取应用中拥有较高的通用性与检测效率,同时在文字辨别正确性方面也有一定的提高。 【重点词】图像文字辨别 K-means 聚类 像素交融 文中经过对现有算法进行剖析与研究,文中提出一种拥有较高通用性的图像与视频文字提取算法,首先对数字图像进行边缘图像办理,其次采用过滤与交融法对文字地区进行放大办理, 最后以 K-means 聚类算法对背景像素和文字像素进行聚类切割办理,进而获得数字图像中的文字地区。该算法能够很好地应付彩色数字图像中的文字提取应用,同时拥有较高的履行效率。 算法整体框架 文中介绍的图像文字算法主要包括文字地区检测、文字 块增强、文字提取以及文字辨别四个中心模块,其中文字识 别模块直接采用 OCR 软件辨别技术, 算法的研究集中在前 3 个模块中。 视频文字检测 算法采用聚类技术奖图像中的边缘进行分解,并形成多 个子图像,进而将不同颜色的图像文字与背风景进行隔绝, 主要步骤包括累积边缘图像的创立、彩色边缘分层办理以及 文字定位三个步骤。 2.1 边缘图像创立 经过定义累积边缘图像,在原数字图像的 Y、U 以及 V 三个分量上进行检测,获得更为丰富的边缘信息,在图像水 平方向、垂直方向以及对角线方向上进行三个维度的边缘检 测,假设  Py、Pu 与  Pv  分别代表数字图像在  Y 、U  与  V  分量 上的边缘图,则计算公式如式  1 所示: Pi=MAX ( SBh, SBv, SBl, SBr),i=Y , U, V ( 1) 其中 SBh、SBv、SBl 与 SBr 分别表示采用 Sobel 检测算 子计算获得的数字图像在水平方向、垂直方向及左右对角线 分量上的边缘强度计算结果。 2.2 彩色边缘分层办理 边缘分层办理是经过对 2.1 中获得的边缘分量图进行着 色办理, 并采用 K-means 聚类算法将着色办理后获得的数字 图像进行像素分类,进而获得不同层次的像素点会合,分别 代表背风景和文字像素。因为不同的边缘图对应着不同的颜 色,因此经过聚类办理后能够将边缘图中的不同颜色进行分 类,获得颜色值相对统一的边缘子图,为文字地区的定位提 供参照。 2.3 文字定位 因为数字图像中的文字地区一般散布比较集中,所以在 2.2 中办理结果上经过水平方向、垂直方向上的投影操作即 可实现对文字地区的初步定位,其次采用鉴于 SVM 向量机 的方法对获得的文字地区进行过滤办理,并采用均值计算、 方差办理、局部同次性等特点剖析,抛弃显然错误的文字区 域辨别结果,进而能够大大提高文字地区的定位正确性。 文字块增强 经过过滤操作提高文字笔画的清晰度,并将获得的文字 笔画进行交融办理进而获得更为正确的文字地区辨别结果。 3.1 文字地区过滤 目前的数字图像与视频多数经过了一定程度的压缩处 理,进而致使图像和视频中的文字笔画比较模糊,所以算法 首先对文字笔画进行增强办理,详细方法是经过对文字块的 水平方向、垂直方向以及两个对角线方向上采用如式 2 所示 的检测算子进行增强办理: TextMap ( x,y) =MAX ( TextInth ,TextIntv , TextIntl , TextIntr ) ( 2) 其中, TextInth 、TextIntv 、TextIntl 、TextIntr 分别代表水 平方向、垂直方向以及左右对角线方向上增强办理后获得的 强度。 3.2 文字地区交融 算法采用局部阈值设定的方法对文字块中的背风景进 前进一步分别,并在此基础上进行平均交融办理,进而降低 噪声对辨别结果的影响。此外,在背风景的交融方面,算法 采用最小值交融技术,进而降低了算法的办理开销,并提高 了办理结果的对照对。其中局部阈值 t 的设置采用 OTSU 法 进行计算获得,并经过对不同文字地区进行平均像素计算得 到各个文字地区的图像会合,最后进行阈值判断,如果图像 会合中的元素大于 t 则将其归为文字部分, 否则归到背风景。 文字提取 4.1 二值化办理 算法在文字提取时首先采用鉴于颜色分量的聚类算法 进行像素二值化办理。详细的操作时经过对交融后的文字块 图像从 Y 、U 和 V 三个分量上进行对照度检测,并选择其中 的最大值作为二值化办理的选择标准。关于单个像素,算法 经过对像素边缘地区的灰度进行分量计算,进而获得用来分 割的局部阈值,最后将像素的灰度值与局部阈值进行对照, 确定其是否属于文字地区。 4.2 噪声去除 经二值化办理后文字块的远景文字拥

文档评论(0)

1亿VIP精品文档

相关文档