- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要
文档图像处理的研究目的就是要利用计算机从文档图像中获取需要的信
息。伯从二十世纪五、六十年代人们丌始这方面的研究以来,不同的系统先后
被研制出来。不过,由于实际中文档种类繁多,形式千变万化,使得文档图像
处理成为一个非常复杂的问题,现今的方法都存在种利,局限。这其中除了问题
本身的复杂性以外,还有一个很重要的原凶就址没有个划文档分析算泄:性能
的有效的评估方法。性能评估是非常重要的。首先需要比较几个相似系统的优
劣;其次,当这个系统被修改时,需要对新的系统进行评估,并和以前的老系
统作比较。于是,性能评估不仅需要对整个系统进行,还需要对系统的各个模
块进行,这样才能准确地定位系统的错误所在,从而才有更多的机会发现整个
系统的薄弱环节,然后针对系统的目标进行改进。以的,文档处理系统中的性
能评估主要只是针对识别率而言,而对版面分析的性能评估则很少有人研究。
近年来,文档图像处理系统越来越复杂,其所处理的文档的版面结构也越来越
复杂,人们越来越认识到对版面分析的性能作评值曲必要性与重要性。本文就
文档版面分析的性能评估作了一些讨论和分析∥首先对文档图像处理和文档分
析作一个简单概述,接着对版面分析现有的评估方法作一个综述,然后我提出
一个基于规则的算法来对版面分析进行评估,并给出了用此方法进行性能评估
时的数据准备和评估结果,最后对这个方法及评估结果作一些分析,并提出了
改进的方向。
关键词:文档图像处理、版面分析、基准测试、性能评估
Abstract
ofDocument toextract
Theresearch Processing(DIP)isnecessary
goal Image
builtsince
informationfrom DIP havebeen 50—
systems
document.Many
paper—based
60’Soflast isa complex sincedocumentshave
century.However,DIPvery problem
all
and methodsforDIP havesome
inbothcontentlayout.The
greatvariety
drawbacksThe ofDIPisdifficultnot becausethe itselfis
problem only problemvery
alsothereisnotaneffectivemethodtoevaluatethe
complex,but performance
document and evaluationare
analysisalgorithm.Benchmarkingperformance very
DIP somesimilar are
for systems needthe
importantsystems.When compared,we
文档评论(0)