- 1
- 0
- 约1.01千字
- 约 3页
- 2020-04-14 发布于湖北
- 举报
null
非监督式的离散化(Unsupervised Discretization) 分类中离散化方法的一个很大的区别是是否使用类别信息。 使用了类别信息的成为监督 式的离散化(supervised) ,没有使用类别信息的成为非监督式的方法(Unsupervised) 。 等宽方法(equal width)将范围内的属性划分成一个用户指定的区间数量,每个区间都有 相同的宽度(width) 。这样的方法受离群值影响很大。因此,等频方法(等深方法) (equal frequency,equal depth) ,是将相同数量的对象分到每个区间中,这也很常用。 监督式的离散化(Supervised Discretization) 使用额外的信息(类标签)通常会产生更好的结果。无类标签知识构造的区间通常会包 含混合的类标签。从概念上讲,分割的简单的方法是最大化区间纯度(purity) 。实际中, 这样的方法需要人工选择区间的纯度和最小的区间大小。 为了克服这样的困难, 一些统计的 方法被用来解决这些问题。先将每个类的值都作为单独的区间,再根据统计测试,合并临近 的相似区间(adjacent intervals)获取更大的区间。基于熵(entropy)的方法是很好的。 有太多值得类别属性(Categorical Attributes with Too Many Values) 类别属性有时
您可能关注的文档
- 数据透视表分析.pptx
- 数据挖掘第五讲(关联及关联知识的发现方法)(第五章).ppt
- 数据挖掘(偶然看到比较好的).ppt
- 数据挖掘(第一部分)spss_clementine11培训1cindy.ppt
- 数据挖掘第一章概论.ppt
- 数据挖掘及其工业应用.ppt
- 数据挖掘技术在dna数据分析中的应用.doc
- 数据挖掘教程-1序论.ppt
- 数据挖掘讨论组讨论vldb文章-accurateande.ppt
- 数据挖掘入门--精简.ppt
- 中国国家标准 GB/T 4023.3-2026半导体分立器件 第3部分:信号、开关和调整二极管.pdf
- GB/T 4023.3-2026半导体分立器件 第3部分:信号、开关和调整二极管.pdf
- 内蒙古巴彦淖尔市乌拉特前旗第三中学 2025_2026学年九年级上学期期中考试道德与法治试题(含答案).docx
- 山东省德州市陵城区2025_2026学年八年级上学期期中考试道德与法治试题(文字版,含答案).docx
- 2026年安全生产月隐患排查典型案例警示教育PPT.pptx
- 锂电池充电仿真试验报告流程及注意事项.docx
- 锂电产业分析报告.docx
- 镜像实验报告结果.docx
- 镜子的魔力研究报告.docx
- 镜画仪实验报告.docx
最近下载
- 政府采购案例分析解析.ppt VIP
- 重庆市西南大附属中学2023-2024学年英语八下期末学业质量监测试题含答案.doc VIP
- 铁路客服信息工程施工工艺规范汇编-V1.0.docx VIP
- 10 铁路建设工程监理规范.ppt VIP
- 年研发2.6万千瓦铝-空气金属燃料电池项目可行性报告.doc VIP
- GB∕T 3655-2022 用爱泼斯坦方圈测量电工钢带(片)磁性能的方法.pdf
- ASME B30.10中文版-缆索、起重机、桅杆、提升机、吊钩、起重器、吊索的安全标准.doc VIP
- (2023)精麻药品培训考试题库附含答案 .pdf VIP
- 电信智能云服务交付工程师(网大版)备考试题库大全(附答案).doc VIP
- 安徽省马鞍山市2022-2023学年高一下学期期末考试化学试题原卷版+解析版.docx VIP
原创力文档

文档评论(0)