- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2008牟第11期
中图分类号:TP393 文献标识码:A 文章编号:1009—2552(20o8)11—0041—05
基于灰色理论的整体模式匹配
靳光俊,范学峰,郭文宏,金 玉
(同济大学电子与信息工程学院,上海 200092)
摘 要:模式匹配是DeepWeb研究中的关键问题。现有的模式匹配算法都是基于两两匹配的原
则,同一时刻只能比较两个属性,比较繁琐,当数据源很大时困难很大,效率不高。利用整体
模式匹配的思想,提出了一种新的匹配算法。这个方法引入了灰色理论,将每个接 口属性抽象
成一个向量,每一个向量表示该属性在某一个模式中出现与否。通过比较两个向量各个分量的
值,一次性地处理所有模式,从而从整体上分析属性之间的关联性。实验证明这种方法易于计
算机实现,可以简单、高效地完成模式匹配。
关键词:灰色理论;查询接 口;模式匹配;关联性
Gray-theorybasedholisticschemamatching
JINGuang-jun,FANXue-feng,GUOWen—h0ng,JINYIl
(CoH~e0f~eetronicandInformafi~blginl哪illg,Ton~iI ve随哆,删1gllai2O0092,China)
A~tract:Schemamatchi~ isakeyproblem inDeepWebresearch.Thepresentschema ma tchi~ al~fithms
areaHbasedonpmrwisec0玎叩 sonof interfaces,whicharetoofhssyand,astheamount0fdata~urce
~comesbiggeraJ1dbigger,Seywould~comelabouredaIldnotefficient.Th isp叩erpresentsanew schema
ma tchingMgofithrnusingholisdcschema matchingidea,whichintroducesgreytheoryinSe~hema matching
field,comide~everyinterfacepropertyasal1abs昀ctvector,eachwei~trep~ ntswhe~erSeproperty
印pearsoncertaininterfaceornot.Bycompari~ ever),wei~t0ftwovecto~,itcandealwi廿1allSescherflas
onceandfora11.and~Myzestherelev~cyoftwopm~ ies.Thee~erimentsproveSat山isme山odiseasy
torealizebycomputerandcansimplyaIlde~cienflyfinishschemama tching.
Keywor~ :grayt}leoI)r;inquirymtefface;schemamatching;Ielmlce
0 引言 查询接 口的研究。查询接 口概括了数据库的特征,
~temet上有大量页面是由后台数据库动态产 完全体现了数据库的内容,是Deep b后台数据库
生的,现有的搜索引擎不能索引这部分页面信息,使 的唯一入口,被称为模式。对查询接 口的研究主要
得这部分信息对用户来说是隐藏的,称之为 Deep 是要解决模式匹配问题,而分析接 口属性的相关性
reb。 正是进行模式匹配的首要前提。
Deepweb中的信息没有被主流搜索引擎所索 1 相关研究工作现状
引,主要是 由于技术原因。搜索引擎 的爬虫程序
传统的模式匹配主要是基于两两匹配的方法,
(Crawler)往往可以很容易找到数据库的查询接 口页
您可能关注的文档
最近下载
- 2025年甘肃省武威市凉州区发放镇招聘专业化管理大学生村文书笔试备考试题及答案解析.docx VIP
- 中国宫腔镜诊断与手术临床实践指南(2023年).pptx VIP
- 2025年法律职业资格(客观题)真题含答案.docx VIP
- 展板版式设计.ppt VIP
- 2025年全国司法考试客观题试卷及答案.docx VIP
- 职能科室对医技科室医疗质量督查记录表(检验科、放射科、超声科、功能科、内镜室).pdf VIP
- 中国宫腔镜诊断与手术临床实践指南(2023版).pptx VIP
- 血透患者心理健康宣教ppt.pptx
- 【新教材】英语必修第二册(新人教版)教材习题参考答案.pdf VIP
- 手机数据恢复精灵误删信息轻松恢复.PDF VIP
文档评论(0)