- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据空间查询索研究
摘 要
科学技术的日新月异,带来了信息的飞速膨胀。人们无时无刻不
被包围在信息的海洋之中。如何对这些复杂的信息进行有效管理成为
影响个人生活秩序和生活质量的重要因素。
数据空间以主体为中心,管理主体所关心的所有数据,无论它们
分布在哪,以何种方式呈现,并为主体提供各种服务。与数据库管理
系统不同,数据空间采用pay-as-you-go 的进化方式,逐步形成数据
空间的模式,在欠缺模式指导的情况下,为用户提供Best-effort 查
询服务。
本文研究数据空间管理系统中的关键字查询索引技术。主要工作
包括:
(1)提出了基本信息单元的概念及其获取方法。基本信息单元是某
些相关数据通过相互之间的密切联系构成的一个语义比较完整
的数据子集。
(2)引入基于图的查询索引模型,提出了基于基本信息单元的查询
索引方法。以扩展倒排表的形式为数据空间创建相应的索引—
—BIU-index。BIU-index 的特色在于它以基本信息单元为索引
的基本单位,将用户关心的数据集合在一起,以其作为查询结
果返回,为用户提供了更便捷完备的服务。
(3)利用Lucene 索引工具包生成BIU-index 并设计实现了数据空间
的查询索引子系统,实现对多源异质异构数据的管理。
(4)通过设置相应的实验,验证BIU-index 的性能及其语义完整性。
3
关键词:数据空间;关键字搜索;索引;BIU
4
Abstract
The rapid development of science and technology brings the
expansion of information. People are always surrounded by a lot of
information. How to effectively manage these complex informations has
become an important impactment on the quality of people’s life.
All the data in dataspace is organized by a subject no matter where it
is, which manner it present and which kind of relations it is. Different
from database management system, dataspace’s evolution method is
pay-as-you-go which will gradually form the mode of dataspace. And
dataspace provide users with Best-effort query service in the case of
lacking of mode guidance.
This paper studies the keyword-based searching and indexing
techniques in dataspace management system. The main work includes
four aspects as follows:
(1) In this paper we give the concept of basic information unit and it’s
getting method. The b
文档评论(0)