- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
s-粗集与数据选-过滤
山东大学硕士论文
摘要
自二十世纪七十年代大规模集成电路、超大规模集成电路诞生以来,计算
机已经成为现代工业、商业、农业等各个领域必不可少的一个工具,但随之而
来的是数据的迅速膨胀,使得人类在一个极短的时间里进入了数据爆炸的时代.
这些数据具有巨大性、随机性、不确定性等特征,并且数据的生成过程又往往
存在着动态特征.实际上,在这些大型的、复杂的、信息丰富的数据中,只有一
小部分是人们真正需要的,如何从其中提取出人们所需要的信息,已经成为目
前一个重要的课题,粗集理论是波兰数学家Z.Pawlak在1982年首次提出的,这
是一种处理不完整、不精确问题的新型数学工具,它通过等价关系和近似概念
对数据进行约简以获取知识.粗集知识系统是一个基于规则的系统,它不需要
精确的数学描述,而是对经验的总结,因此非常适合数据处理过程中直观、简
单、易于理解、人性化、智能化的要求,为数据挖掘技术提供了理论基础和研
究思路.
传统的数据挖掘方法是建立在数据不会发生变化的假设下进行讨论的,可
以说是一种静态的数据挖掘方法,实际上数据不可能是一成不变的,当数据发
生变化时,静态的数据挖掘方法便失去了效用,因此传统的数据挖掘方法具有
Sets,简称S一粗集)是Z.Pawlak粗集的一种改
局限性.奇异粗集(SingularRough
进形式.它是山东大学史开泉教授于2002年提出的,是基于元素迁移的概念建
direction
立起来的一种动态粗集.S.粗集具有三种形式:单向S.粗集(One
ofonedirection
S-rough
S-roughsets),单向S.粗集对偶(Dual sets),双向S-粗集
direction
(Two S-roughsets).S一粗集的动态特征、遗传特征、粒度特征等特性,S一
粗集的提出为我们研究动态数据挖掘开辟了一个全新的方向并提供了必要的理
论保证.
本文的主要工作如下:
1.主要介绍了数据挖掘的发展研究现状以及数据挖掘的分类;阐述了粗集
理论提出的背景、发展状况、研究的内容和方向;介绍了S.粗集提出的背景及
山东大学硕士论文
研究现状;并将S.粗集的理论进行了简单的介绍.
2.利用S.粗集的动态特征、遗传特征、粒度特征等特性,给出了S-粗集与
数据筛选一过滤的研究,讨论了数据的粒度特征、单向筛选.过滤、双向筛选-过
滤,给出了厂一筛选一过滤度、7一筛选一过滤度和莎.筛选.过滤度的概念,并提出
了筛选.过滤定理和筛选.过滤准则.
3.提出了基于S.粗集的动态聚类方法,利用第3章给出结果,提出了一种
基于S一粗集的动态聚类算法.利用此算法改进了无线传感器网络的分簇算法,
通过仿真,并与现有算法比较后,得到这样的结论:使得每个节点的能量得到
均匀的使用,提高了节点的能效比,满足了无线传感器网络节能的要求.
关键词 S。粗集;数据挖掘;数据筛选.过滤;聚类算法
II
山东大学硕士论文
ABSTRACT
Since integration)
LSI(Large—scaleintegration)andSLSI(super—large—scale
havebeen from1 havebeenanindispensableimplement
produced970s,computers
and data
inmodem expanding
industrie
文档评论(0)