基于大型样本笔迹库的笔迹信息挖掘.pdfVIP

基于大型样本笔迹库的笔迹信息挖掘.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大型样本笔迹库的笔迹信息挖掘.pdf

基于大型样本笔迹库的笔迹信息挖掘 邓伟陈庆虎曹华军 (武汉大学电子信息学院武汉430079) (sdengwei@sina.com) 摘要: 面向大型样本笔迹库,本文提出笔迹信息的数据挖掘方法。利用笔迹的方向特征,通过对大 型样本笔迹库进行数据挖掘与统计分析,得到书写汉字匹配距离的一些统计特征,这些统计特征与书写汉 字的文本内容及笔莉有密切的联系,有一定的规律性。这些特征和规律性为笔迹鉴别提供了新的途径,为 笔迹鉴别的理论和方法研究提供了新信息。 关键词: 笔迹鉴别数据挖掘方向特征 Data of InfoBasedon MiningHandwriting Handwriting DataBase DENG Wei,CHENQing-hu ofElectronics (School Information,WuhanUniversity,Wuhan,430079,China) the article the information Abstract:Facinglarge-scalehandwritingdatable,thisproposedhandwriting data the directional data andstatistical miningmethod.Usinghandwritingcharacteristic,throughmining analysis database.somecharacteristicsof distanceofwrittenChinesecharacter tothe statistical handwriting matching of obtained.Thesestatisticalcharacteristicshavecertain andhavecloserelationwithstrokeandcontent regularity thewrittentext。Thesecharacteristicsandthe neWinfoforthe distinction regularityprovided handwritingtheory. identification,data feature KeyWords:handwritingmining,directional 1.引言 面向大型样本笔迹库的笔迹鉴别是用检材笔迹与大型数据库的样本笔迹分别进行比对 鉴别,其目的是在库中找出与检材笔迹书写风格最相似的样本笔迹。通常,按笔迹特征进行 距离匹配来确定两封笔迹的相似程度,距离值越小,笔迹相似程度越高,排序越靠前。 目前,笔迹鉴别方法有文本依存(基于相同字)和文本独立(与文本内容无关)两大类 方法。具体地讲,文本依存法是在检材笔迹与样本笔迹中分别找出相同的书写汉字,计算其 笔迹特征,计算相同字的特征距离,用这些距离值进行分类和鉴别。在一对一笔迹鉴别中, 文本依存法是常用方法,且非常有效。 面向大型的样本笔迹库,文本依存法在一对多的笔迹鉴别中无法直接使用。 设笔迹库中有样本M个。检材J与第i号样本r有Ⅳf个相同汉字tZl,z2,z3…zⅣf}, 提取相同字图像的特征向量进行比对,得到相同字的M个距离值p1,d2,d3…dMj。不同 的样本Z与检材J有不同的相同字,不同的书写汉字算出的距离值不能直接比较。如“人” 字和“的”字有笔画差异,利用“人”的特征匹配出的距离值为d人,利用“的”的

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档