- 4
- 0
- 约6.76千字
- 约 8页
- 2017-08-27 发布于安徽
- 举报
西南大学荣昌校区 信息管理系 《数据挖掘与数据仓库》课程试题 【A】卷
2012~CURE算法采用了一种新颖的层次聚类算法,该算法选择基于质心和基于代表对象方法之间的中间策略。CURE算法:利用代表点聚类 CURE算法采用了一种新颖的层次聚类算法,该算法选择基于质心和基于代表对象方法之间的中间策略。它不用单个质心或代表一个簇,而是选择数据空间中固定 数目的具有代表性的点。簇的代表点产生方式:首先选择簇中分散的对象,然后根据一个特定的分数或收缩因子向簇中心“收缩”或移动它们。在算法每一步,有最 近距离的代表点对(每个点来自不同簇)的两个簇合并。 CURE算法的核心步骤: (1) ? 从源数据对象中抽取一个随机样本S; (2) ? 将样本S分割为一组划分; (3) ? 对每个划分局部地聚类; (4) ? 通过随机取样剔除孤立点。如果一个簇增长得太慢,就去调它; (5) ? 对局部得簇进行聚类。落在每个新形成得簇中的代表点根据用户定义的一个收缩因子;收缩或向簇中心移动; (6) ? 用相应的簇标签来标记数据。 优点:CURE的复杂度是O(n),对孤立点的处理更加健壮,可识别非球形和大小变化较大的簇;对大型数据库也有良好的伸缩性;支持复杂形状和不同大小的聚类;敏感度低。 缺点:不能处理分类属性
CURE聚类算法的实现
任务背景
聚类(clustering)就
您可能关注的文档
- 深化对中国特色社会主义的认识.pdf
- 深刻领会和全面把握科学发展观.ppt
- 深入开展心理素质教育有效促进学生全面发展.ppt
- 神华现代煤制油化工工程建设与运营实践.pdf
- 渗透测试实验平台的开发应用.pdf
- 生产与经济制度 2.ppt
- 生产运作与管理课件text5.ppt
- 生成有效的板支持包.pdf
- 生活经济论文民营经济论文.pdf
- 生物化学工程习题.ppt
- 2025年四川省眉山实验高级中学化学高一下期末调研试题含解析.doc
- 电力故障应急预案培训.pptx
- 河南省开封市杞县金杞学校2024-2025学年数学三年级第二学期期末质量检测模拟试题含解析.doc
- 2026年重庆市沙坪坝区第一中学高三生物试题月考试卷试卷含解析.doc
- 浙江财经大学《企业与公司法》2023-2024学年第一学期期末试卷.doc
- 云南交通运输职业学院《建筑材料(C)》2023-2024学年第二学期期末试卷.doc
- 2025届福建省泉州市惠安四中学、东山中学物理八上期末达标检测模拟试题含解析.doc
- 2026届成都石室中学高三4月高考模拟考试生物试题含解析.doc
- 天津城建大学《CFA财务报告分析II》2023-2024学年第二学期期末试卷.doc
- 电力计量管理培训.pptx
最近下载
- 2026抖音内衣类目达人准入内衣泳衣类目准入考试题库解析.docx
- 玉柴YC6108G发动机零件图册.pdf VIP
- 无人机测绘-无人机航飞教学课件.ppt VIP
- 《力学、电磁学》习题答案详解(程稼夫).pdf VIP
- 2021年高考生物真题 新课标卷Ⅰ有答案word版.pdf VIP
- 2026年雄鹰杯小动物医师技能大赛必练题库(350题).doc VIP
- 2026住院医师规培-重庆-重庆住院医师规培(全科医学)历年参考题库含答案详解5卷试题.docx VIP
- 八年级数学下册 正方形中十字架模型(解析版).pdf VIP
- 玉柴YC4D120-20-D1008发动机零件图册.pdf VIP
- 税务自查报告模板(2篇).docx VIP
原创力文档

文档评论(0)