- 1、本文档共48页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文的提供参考!!
摘要
和信息检索技术结合起来,为用户提供更友好的检索方式。但是,当前XML关键字检
索主要关注的是如何在单个或者少数个文档中找出匹配的结果。随着Web数据的爆炸
式增长,针对尊全茎堂墓耋璺仝领崮邀羞竣丝室明显已经不能满足用户的查询需求。
如何在多领域、海量异构XML数据上进行高效准确的关键字查询成为一个重要问题。
传统的数据集成技术为异构多数据源问题的提供了一个可行的解决方法。但是数
据集成需要使用一个中间模式将源数据集映射为一个统一的数据文档,改变了原始数
据的结构和特征,并不适合关键字检索的特点。针对多领域海量数据的特点,本文提
出了一种在多领撼xMI二熟堡集上进行高效关键字检索的方法,首先使用模式塞耋步
各个数据集分为数个领域,然后利用这些领域划分结果通过信息检索技术推测查询关
’·__’’’-._—.,_。’-_,, L
键字的语义,进而过缝墨鲎短氆序。整个处理过程可以分为两个部分:一
首先,针对海量数据和XML树形结构的特点,本文提出了一利(新颖方效的XML
模式聚类方法,可以在无人工干预的情况下将XML数据集根据其模式聚集到不同的
对查询的关键字,对坦羞塑基i土算
;字的查询语义和领域的紧密程度,
芋后将结果返回给用户。
关键词:XML模式,关键字检索,结块层次聚类,信息检索
中图分类号:TP3
4
Abstract
XML searchbecomesaresearch these duetotheconveniencefor
keyword hotspotyears
useand natureof search
keyword combinestheXML
user-friendly technology.It
andinformationretrieval
processingtechnique to the resultforuser.
produceproper
XML search
However,current focuseson resultin orseveral
keyword finding single
documents.The ofwebdata XML
explosivegrowth searchon
already keyword
requires
of
documentratheron document.Thisshouldbemorecrucial
largequantity single problem
sincethecurrentwebuseranddata
has fasterandfaster.
grown
您可能关注的文档
最近下载
- 纪委监委纪检监察室2024年工作总结及2025年工作计划范文.docx VIP
- T_SBIAORG 001-2023 间充质干细胞外泌体质量控制标准.pdf
- 仓储装卸搬运费合同范本.docx VIP
- 2025年 (第一季度)专题党课讲稿2篇:强作风建设锤炼过硬能力与基层治理专题党课讲稿.pdf VIP
- 民宿项目详细风险分析及评估报告.docx
- 加入我们拯救生命”无偿献血知识竞赛题库及答案.pdf VIP
- Day3_阿宝姐百万年薪公开课_vF5D.pdf VIP
- 提高住院患者腕带佩戴率.pptx
- 前瞻产业研究院:2024年中国中式养生水行业发展趋势洞察报告.pdf
- 幼儿园大班健康《我是健康小卫士》课件.pptx VIP
文档评论(0)