- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
概率数据库及有查询技术的研究
摘要
在信息检索、传感器数据和图像识别等领域中,存在着大量不确
定性的数据。当把这些数据存储到数据库时,要求数据库有对其进行
处理的能力,而传统的数据库都是确定性的,不能对不确定性信息进
行处理。因此,概率数据库逐渐成为研究的热点之一。
本文首先描述了概率数据库的研究背景、现状和广泛应用,介绍
了两种广泛应用的概率数据库模型,分析了目前概率关系模型的缺
点,并针对缺点对概率关系模型进行了改进,把其中的元组重新分类,
并采用不同的概率计算公式,有效的解决了投影不合理的问题。
其次对概率数据库中数字属性的模糊查询技术进行了研究,通过
建立模糊集、选择隶属函数、调整模糊范围等一系列操作,逐步完成
了模糊到精确的查询过程。提出了可信度的基本概念,通过设置可信
度能有效地减少低概率元组的数量,所以查询得到的数据能更好的满
足用户的要求,同时也能降低查询的时间。
目前,聚集函数是直接应用于每一个可能世界的,且在线性时间
内不可计算。本文把聚集函数直接应用于原概率关系,通过转换和存
储过程等方法对每一个元组进行计算,使得能够在线性时间内计算其
结果,理论分析和实验证明了该方法的正确性。同时把每一个聚集函
数分为三个聚集分量,得到的聚集结果能更好的满足用户的多方面需
要。针对AVG提出近似计算(AC)算法,实验结果表明该算法在很大
程度上缩短了计算时间,且具有较低的错误率,所以AC算法的结果
可以作为概率数据库中AVG的精确值。
关键词概率数据库,隶属函数,模糊查询,聚集函数
ABSTRACT
inforlnation
Therearelotsofuncertaindatainthe retrieval,sensor
dataand needto thisuncertain
imageprocessing.Databaseprocess
cannot
whenitiSstoredindatabase.Thetraditionaldatabase
information
doit researchon databasebecomesmoreand
verywell,SO probabilistic
more
important.
The describestheresearch wider
paperfirstly background,status,the
twoextensive
useofthe databaseandintroduces
probabilistic applied
databasemodels.We current about
probabilistic analyze shortcomings
databaseandmakesome aboutit.Its iS
probabilistic improvementtuples
formulatocalculatethe
re-classifiedsomestandardandtakendifferent
by
unreasonableis
about
文档评论(0)