- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
6.2.4基于网格的聚类方法STING(STatisticalINformationGrid)算法是一种格的多分辨率聚类技术,它将空间区域划分为矩形单元。针对不同级别的分辨率,通常存在多个级别的矩形单元,这些单元形成了一个层次结构,高层的每个单元被划分为多个低一层的单元。高层单元的统计参数可以很容易地从低层单元的计算得到。这些参数包括:属性无关的参数count,属性相关的参数m(平均值),s(标准偏差),min(最小值),max(最大值),以及该单元中属性值遵循的分布(Distribution)类型。第31页,共71页,星期日,2025年,2月5日6.2.4基于网格的聚类方法STING算法效率高,是独立于查询的,且利于并行处理和增量更新。但由于STING采用了一个多分辨率的方法来进行聚类分析,聚类的质量取决于网格结构的最低层粒度。如果数据粒度比较细,处理的代价会明显增加,而且该算法没有考虑子单元和其他相邻单元之间的关系。尽管该算法处理速度较快,但是可能会降低簇的质量和精确性。第32页,共71页,星期日,2025年,2月5日6.2.5基于模型的聚类方法基于模型的聚类方法试图优化给定的数据和某些数学模型之间的适应性。给每一个聚类假定一个模型,然后去寻找能够很好的满足这个模型的数据集。这样一个模型可能是数据点在空间中的密度分布函数或者其它。它的一个潜在的假定就是:目标数据集是由一系列潜在的概率分布所决定的。在这类算法中,聚类的数目也根据统计数字自动决定,噪声和孤立点也是通过统计数字来分析。基于模型的聚类方法主要有三类:统计学方法、神经网络方法以及基于群的聚类方法。第33页,共71页,星期日,2025年,2月5日6.2.5基于模型的聚类方法1.统计学方法从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。概念聚类就是其中的一种。概念聚类的绝大多数方法都采用了统计学的途径,在决定概念或聚类时,使用概率度量。它将数据分成多组,对一组未标记的数据对象产生一个分类模式,并对每个分类模式给出其特征描述,即每组对象代表了一个概念或类。在这里,聚类质量不再只是单个对象的函数,而是加入了如导出的概念描述的简单性和一般性等因素。第34页,共71页,星期日,2025年,2月5日6.2.5基于模型的聚类方法1.统计学方法COBWEB是一种典型的简单增量概念聚类算法,以一个分类树的形式创建层次聚类。它的输入对象用“分类属性—值”对来描述。在给定一个新的对象后,COBWEB沿一条适当的路径向下,修改计数,以寻找可以分类该对象的最好节点。该判定将对象临时置于每个节点,并计算划分结果的分类效用。产生最高分类效用的位置应当是对象节点的一个好的选择。第35页,共71页,星期日,2025年,2月5日6.2.5基于模型的聚类方法1.统计学方法COBWEB可以自动修正划分中类的数目,不需要用户提供输入参数。缺点是COBWEB基于这样一个假设:在每个属性上的概率分布是彼此独立的。但这个假设并不总是成立。分类树对于偏斜的输入数据不是高度平衡的,它可能导致时间和空间复杂性的剧烈变化。COBWEB不适用于聚类大型数据库的数据。第36页,共71页,星期日,2025年,2月5日6.2.5基于模型的聚类方法2.神经网络方法神经网络以其分布式存储、并行协同处理以及自学习等特性被用于聚类分析领域。在聚类分析中经常被用到的神经网络的方法有:Kohonen自组织神经网络竞争神经网络自组织共振神经网络这些方法都涉及有竞争的神经单元。第37页,共71页,星期日,2025年,2月5日6.2.5基于模型的聚类方法2.神经网络方法竞争学习(CompetitiveLearning)采用了若干个单元的层次结构,它们以一种“胜者全取”的方式对系统当前处理的对象进行竞争。在一个簇中获胜的单元成为活跃的,而其他单元是不活跃的。各层之间的连接是激发式的,即在某个给定层次中的单元可以接收来自低一层次所有单元的输入。在一层中活动单元的布局代表了高一层的输入模式。第38页,共71页,星期日,2025年,2月5日6.2.5基于模型的聚类方法2.神经网络方法在某个给定层次中,一个簇中的单元彼此竞争,对低一层的输出模式做出反应。一个层次内的联系是抑制式的,以便在任何簇中只有一个单元是活跃的。获胜的单元修正它与簇中其他单元连接上的权重,以便未来它能够对与当前对象相似或一样的对象做出较强的反应。如果我们将权重看作定义的一个标本,那么新的对象被分配给具有最近标本的簇。结果簇的数目和每个簇中单
您可能关注的文档
- 急诊患者心理护理.ppt
- 旅游业公关机构和人员下.ppt
- 生物技术实践课件.ppt
- 沙龙国际小学英语课堂教学内容分析.ppt
- 糖尿病健康教育与管理.ppt
- 生殖道支原体诊治专家共识的解析.ppt
- 第一节场效应管.ppt
- 护理相关的临床抗菌药物合理应用.ppt
- 核磁共振临床应用.ppt
- 第五章卫气营血辨证.ppt
- 中国国家标准 GB/T 48000.1-2025标准数字化 第1部分:通用指南.pdf
- GB/T 48000.1-2025标准数字化 第1部分:通用指南.pdf
- GB/T 32452-2025航天术语 空间环境.pdf
- 《GB/T 32452-2025航天术语 空间环境》.pdf
- 中国国家标准 GB/T 32452-2025航天术语 空间环境.pdf
- 中国国家标准 GB/T 17680.6-2025核电厂应急准备与响应准则 第6部分:场内应急组织与职能.pdf
- 《GB/T 17680.6-2025核电厂应急准备与响应准则 第6部分:场内应急组织与职能》.pdf
- GB/T 17680.6-2025核电厂应急准备与响应准则 第6部分:场内应急组织与职能.pdf
- GB/T 17680.8-2025核电厂应急准备与响应准则 第8部分:场内核应急预案与执行程序.pdf
- 《GB/T 17680.8-2025核电厂应急准备与响应准则 第8部分:场内核应急预案与执行程序》.pdf
最近下载
- DeepSeek 政务办公创新突围讲义精华全版 369页 2025.pptx VIP
- 基础生命体征指标及分析标准解读.docx VIP
- 2024-2025学年辽宁省大连市滨城高中联盟高一上学期期中考试数学试题(解析版).docx
- 2025至2030中国异戊橡胶行业运行态势及发展走势展望分析报告.docx
- 2025四川成都教科院附属龙泉学校优秀应届毕业生教师招聘考试备考题库及答案解析.docx VIP
- 建筑防腐蚀工程施工质量验收规范.docx VIP
- 视觉传感器及其应用.ppt VIP
- 正态分布(高中数学人教A版选修2-3).pdf VIP
- 血透室护士在医疗行为中的职业暴露与职业防护专家讲座.pptx VIP
- 水利工程事故应急方案【精选资料】.doc VIP
原创力文档


文档评论(0)