一种基于高斯混合模型的不确定数据流聚类方法.PDF

一种基于高斯混合模型的不确定数据流聚类方法.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于高斯混合模型的不确定数据流聚类方法.PDF

一种基于高斯混合模型的不确定数据流聚类方法 1,2 1 1 曹振丽 孙瑞志 李勐 1 (农业部农业信息获取技术重点实验室 北京100083) 2(中国农业大学烟台研究院 烟台264670) (E-mail: caozhenli2004@ 163.com) A Method for Clustering Uncertain Data Streams Based on GMM 1,2 1 1 Cao Zhenli , Sun Ruizhi , Li Meng 1(Key laboratory of Agricultural information acquisition technology, China Agricultural University, Beijing 100083) 2(Yantai Academy, China Agriculture University, Yantai 264670) Abstract With the sensors widely used, it brings a lot of uncertain data streams. When the input datas are continuously random variables, the existing clustering method based on discrete random variables can not meet the requirements of efficiency and accuracy. In order to solve the problem mentioned above , we propose a new method which was named cmicro algorithm. First, we use the Gaussian mixture model as the basic representation of uncertain data streams. Second, we propose a clustering method which can find clustering in time dimension . This method can make up for the deficiency of traditional clustering which can ’t find the non-spherical clustering. Third, we discuss the influence of the different parameter values by experiment. Finally, the compared result shows that the proposed algorithm promotes the accuracy of clustering. Key words Gaussian Mixture Model; uncertain data streams; clustering; sensor; sketch 摘 要 传感器的广泛应用产生了大量的不确定数据流,在聚类应用中,当输入数据为连续型随机变量时,现有基于离散型 随机变量的聚类方法无法满足数据流应用在效率和精度上的要求。本文使用高斯混合模型作为不确定数据的基本表示形式, 仅需要保存不同组件的描述信息即可,可以更好的利用存储空间,完成对真实情况的逼近,并提出了一种可以发现时间维度 上的不确定数据流聚类方法 cumicro, 该算法将时间直接作为数据属性,可直接查询某个时间维度的聚簇,避免了传统基于 划分的聚类中较难发现非球状聚簇的问题。通过实验与经典算法umicro 进行比较,证明了本文算法的有效性,并分析了不 K Tau 同 值、 值下的聚类结果。最后得出结论,原始数据较密集时,相较原有基于离散模型的聚类,该算法具有准确度上 的优势。 关键词 高斯混合模型;不确定数据流;聚类;传感器; 概要结构 中图法分类号 TP393 收稿日期: yyyy-mm-dd 基金项目:国家科技支撑计划(2012BAH26B01)、山东省科技发展计划(2014GNC110026). 作者简介:曹振丽 (1979-),中国农业大学信息与电气工程学院博士生,中国农业大学烟台研究院讲师,主要从事农业信

文档评论(0)

sunyangbill + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档