基于灰色理论的整体模式匹配.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2008牟第11期 中图分类号:TP393 文献标识码:A 文章编号:1009—2552(20o8)11—0041—05 基于灰色理论的整体模式匹配 靳光俊,范学峰,郭文宏,金 玉 (同济大学电子与信息工程学院,上海 200092) 摘 要:模式匹配是DeepWeb研究中的关键问题。现有的模式匹配算法都是基于两两匹配的原 则,同一时刻只能比较两个属性,比较繁琐,当数据源很大时困难很大,效率不高。利用整体 模式匹配的思想,提出了一种新的匹配算法。这个方法引入了灰色理论,将每个接 口属性抽象 成一个向量,每一个向量表示该属性在某一个模式中出现与否。通过比较两个向量各个分量的 值,一次性地处理所有模式,从而从整体上分析属性之间的关联性。实验证明这种方法易于计 算机实现,可以简单、高效地完成模式匹配。 关键词:灰色理论;查询接 口;模式匹配;关联性 Gray-theorybasedholisticschemamatching JINGuang-jun,FANXue-feng,GUOWen—h0ng,JINYIl (CoH~e0f~eetronicandInformafi~blginl哪illg,Ton~iI ve随哆,删1gllai2O0092,China) A~tract:Schemamatchi~ isakeyproblem inDeepWebresearch.Thepresentschema ma tchi~ al~fithms areaHbasedonpmrwisec0玎叩 sonof interfaces,whicharetoofhssyand,astheamount0fdata~urce ~comesbiggeraJ1dbigger,Seywould~comelabouredaIldnotefficient.Th isp叩erpresentsanew schema ma tchingMgofithrnusingholisdcschema matchingidea,whichintroducesgreytheoryinSe~hema matching field,comide~everyinterfacepropertyasal1abs昀ctvector,eachwei~trep~ ntswhe~erSeproperty 印pearsoncertaininterfaceornot.Bycompari~ ever),wei~t0ftwovecto~,itcandealwi廿1allSescherflas onceandfora11.and~Myzestherelev~cyoftwopm~ ies.Thee~erimentsproveSat山isme山odiseasy torealizebycomputerandcansimplyaIlde~cienflyfinishschemama tching. Keywor~ :grayt}leoI)r;inquirymtefface;schemamatching;Ielmlce 0 引言 查询接 口的研究。查询接 口概括了数据库的特征, ~temet上有大量页面是由后台数据库动态产 完全体现了数据库的内容,是Deep b后台数据库 生的,现有的搜索引擎不能索引这部分页面信息,使 的唯一入口,被称为模式。对查询接 口的研究主要 得这部分信息对用户来说是隐藏的,称之为 Deep 是要解决模式匹配问题,而分析接 口属性的相关性 reb。 正是进行模式匹配的首要前提。 Deepweb中的信息没有被主流搜索引擎所索 1 相关研究工作现状 引,主要是 由于技术原因。搜索引擎 的爬虫程序 传统的模式匹配主要是基于两两匹配的方法, (Crawler)往往可以很容易找到数据库的查询接 口页

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档