基于Vague集不确定数据模型.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Vague集不确定数据模型

基于Vague集不确定数据模型   摘要:不确定数据广泛的存在日常生活中,不确定数据挖掘是当前重要方向研究方向。研究者必须通过对象的可能世界实例,得到概率密度函数。当对象的可能世界实例缺失时,经典不确定数据的模型将束手无策。对Vague集进行扩展,提出一种新的面向不确定数据的Vague集模型,即U-Vague集模型。并定义了U-Vague集模型之间的距离。通过直接聚类算法对模型的有效性进行了验证。最后对不确定数据的研究做出了展望 关键词:可能世界;实例缺失;U-Vague集;距离;直接聚类 中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2017)01-0218-04 1 引言 不确定数据即带有不确定性(uncertainy)的数据,数据的不确定性产生的原因有多种,可能是原始数据本来不准确或采用了粗粒度的数据集合,也可能是原始数据是为了满足特殊应用目的或经过处理或者数据集成而生成的[1]。不确定性的主要表现形式为随机性和模糊性。当前,学者已提出的不确定数据对象的模型,为可能世界(possible world)模型以及根据可能世界模型衍生的特殊模型。表1表示的为一组上海市嘉定区某日,气温采集数据。气温数据,分别由10个散布在嘉定区不同区域的温度采集传感器获得 将嘉定区气温视为不确定对象,可以根据气温数据建立嘉定区气温的可能世界模型,如表2所示, c表示嘉定区气温可能世界实例(possible world instance),p(c)为不确定对象即嘉定区气温取值为c时的概率,概率值由各气温数据出现频率计算得出。由表2,即可对嘉定区气温数据进行下一步处理 当传感器由于老化或者损坏等原因,导致采集到的数据存在缺失,如表3所示,传感器P2、P6和P8的数据无法获得 此时,由于可能世界实例的不完整,无法对气温建立可能世界模型,完全限制了对数据继续处理。在传统确定数据挖掘的研究中,也存在数据缺失或不完备的情形,如[2]、[3]、[4]等采取的策略均是直接忽略丢失部分,其结果往往会导致真实信息的丢失。文章对Vague集理论进行扩展,提出了U-Vague集模型和U-Vague集之间的距离度量 在文章第二节中介绍了Vague集理论相关定义,第三节定义了U-Vague集模型及U-Vague集之间的距离。第四节中,对U-Vague集模型的有效性,进行了验证。最后对不确定数据的模型的研究和Vague集的研究做出了展望 2 相关定义 Vague集作为Fuzzy集的拓展集,引入了假隶属度函数,比Fuzzy集具有更强的表达能力和灵活性 定义1[5]令为点集空间,用表示其中的元素,的一个Vague集可以用真隶属度函数和假隶属度函数表示。表示从支持的证据所导出的的肯定隶属度的下界,是从反对的证据所到处的的否定隶属度的下界,为相对Vague集的Vague值(Vague value),和分别是到的一个映射 3.1 U-Vague集的定义 定义4 对不确定数据对象集合,由集合中所有元素的可能世界实例的集合组成的实例空间为,即。将等距离划分成为个子空间,即称为的可能世界实例集合区间,后文简称为集合区间。用公式表达即为: 定义5对于给定不确定数据对象集合,中的对象,根据定义2和定义4将的可能世界实例集合按集合区间分割成为个子区间,即其中。称为不确定对象关于集合区间的区间二元组,其中即为不确定对象关于可能世界实例子集合的概率。。可将不确定对象表示为区间二元组集合,即为: 定义6对于不确定对象集合以及可能世界空间,不确定数据对象可以用一个真区间隶属度函数和一个假区间隶属度函数表示。表示支持对象取值在集合区间的证据的下界,表示反对对象取值不在集合区间的证据的下界称为对象关于集合区间的U-Vague值 对于不确定对象由公式,可得 即表示对象的缺失实例均不在集合区间内时,取值为集合区间概率,即为。表示对象缺失实例均在集合区间内时,取值为集合区间概率,即为 不确定对象的U-Vague集模型就可以表示为: 不确定对象集合为: 即称为不确定对象集合的U-Vague集矩阵 下面通过对一组温度数据集合,模拟U-Vague集的模型建立过程。图1为某省5个市不同监测站在同一天所采集到的温度数据,由于传感器和数据保存的过程中疏忽,造成图1中的部分数据难以获得,―表示传感器数据丢失,黑色为被污染区域 首先,用温度数据矩阵对图1进行表示,为: 然后根据温度数据矩阵的元素,划分可能世界实例集合区间,设k=5 可以得到温度数据的实例集合区间,用轴线进行表述,如图2所示对中温度数值进行根据等距划分: 最后由各可能实例集合的真隶属度与假隶属度函数建立每个市的U-

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档