- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于高斯混合模型的不确定数据流聚类方法.PDF
一种基于高斯混合模型的不确定数据流聚类方法
1,2 1 1
曹振丽 孙瑞志 李勐
1 (农业部农业信息获取技术重点实验室 北京100083)
2(中国农业大学烟台研究院 烟台264670)
(E-mail: caozhenli2004@ 163.com)
A Method for Clustering Uncertain Data Streams Based on GMM
1,2 1 1
Cao Zhenli , Sun Ruizhi , Li Meng
1(Key laboratory of Agricultural information acquisition technology, China Agricultural University, Beijing 100083)
2(Yantai Academy, China Agriculture University, Yantai 264670)
Abstract With the sensors widely used, it brings a lot of uncertain data streams. When the input datas are continuously random
variables, the existing clustering method based on discrete random variables can not meet the requirements of efficiency and accuracy.
In order to solve the problem mentioned above , we propose a new method which was named cmicro algorithm. First, we use the
Gaussian mixture model as the basic representation of uncertain data streams. Second, we propose a clustering method which can
find clustering in time dimension . This method can make up for the deficiency of traditional clustering which can ’t find the
non-spherical clustering. Third, we discuss the influence of the different parameter values by experiment. Finally, the compared result
shows that the proposed algorithm promotes the accuracy of clustering.
Key words Gaussian Mixture Model; uncertain data streams; clustering; sensor; sketch
摘 要 传感器的广泛应用产生了大量的不确定数据流,在聚类应用中,当输入数据为连续型随机变量时,现有基于离散型
随机变量的聚类方法无法满足数据流应用在效率和精度上的要求。本文使用高斯混合模型作为不确定数据的基本表示形式,
仅需要保存不同组件的描述信息即可,可以更好的利用存储空间,完成对真实情况的逼近,并提出了一种可以发现时间维度
上的不确定数据流聚类方法 cumicro, 该算法将时间直接作为数据属性,可直接查询某个时间维度的聚簇,避免了传统基于
划分的聚类中较难发现非球状聚簇的问题。通过实验与经典算法umicro 进行比较,证明了本文算法的有效性,并分析了不
K Tau
同 值、 值下的聚类结果。最后得出结论,原始数据较密集时,相较原有基于离散模型的聚类,该算法具有准确度上
的优势。
关键词 高斯混合模型;不确定数据流;聚类;传感器; 概要结构
中图法分类号 TP393
收稿日期: yyyy-mm-dd
基金项目:国家科技支撑计划(2012BAH26B01)、山东省科技发展计划(2014GNC110026).
作者简介:曹振丽 (1979-),中国农业大学信息与电气工程学院博士生,中国农业大学烟台研究院讲师,主要从事农业信
您可能关注的文档
最近下载
- 2025-2030中国牛仔服装行业市场深度发展趋势与前景展望战略研究报告.docx
- 八大特殊作业安全管理培训(最新版课件).pptx
- 酒店管理专业人才需求调研报告.doc VIP
- 个人业绩相关信息采集表含政治表现、最满意、主要特点、不足.pdf VIP
- 新22J09 附属建筑-标准图集.docx VIP
- 世界各国语言.doc VIP
- 《新媒体传播》课件.ppt VIP
- 2025年安全员c2考试试题库(答案+解析).docx
- GBT45001-2020SO45001:2018 职业健康安全管理体系要求及使用指南.pdf VIP
- 部编版六年级上册道德与法治教案:感受生活中的法律知识.docx VIP
文档评论(0)