- 64
- 0
- 约1.07万字
- 约 10页
- 2017-05-03 发布于湖北
- 举报
连续值的离散化
连续值的离散化
许文烈
成均馆大学
1、为什么要进行离散化?
1.1 什么是连续属性离散化
连续属性的离散化就是在特定的连续属性的值域范围内设定若干个离散化
的划分点,将属性的值域范围划分为一些离散化区间,最后用不同的符号或整数
值代表落在每个子区间中的属性值。对连续属性的离散化过程,从本质上来看,
就是利用选取的断点来对条件属性构成的空间进行划分的过程。
1.2 连续属性离散化的目的
连续值离散化的目的是为了简化数据结构。
数据通常有这样几种类型:标称型,离散型和连续型。现实生活中的数据往
往来源于复合型,例如许多数据是数值型与离散型的复合。这就需要有一个统一
的数据类型来进行数据处理。
通过将属性值域划分为区间,数据离散化技术可以用来减少给定连续属性值
的个数。离散属性比连续属性更接近于知识级的表达。对用户和专家而言,离散
属性更易理解、使用和解释。
离散化方法经常作为数据挖掘的工具,而使用离散属性所获得的结果(决策
树、归纳法则)往往更紧凑、简短和精确因此其结果也更易被检查、比较、使
您可能关注的文档
最近下载
- 第2课++生涯规划+筑梦未来(课时1)【中职专用】中职思想政治《心理健康与职业生涯》高效课堂 (高教版基础模块).pptx VIP
- 加工高硫高酸高氯原油的腐蚀与控制.pptx VIP
- 初中考纲英语核心单词表(中考适配版).docx VIP
- sh interconnect cable ht3haps互连板电缆参考手册.pdf VIP
- 30以内加减法练习题.doc VIP
- 基于Hive数据仓库的瓜子网二手车数据分析系统设计与实现.doc VIP
- 2026年常州工业职业技术学院单招综合素质考试题库带答案详解.docx VIP
- 基于MSPA-MCR的滨江城市蓝绿空间生态网络构建——以安徽省芜湖市为例.pdf VIP
- 2025年安徽机电职业技术学院单招职业适应性测试题库往年题考.docx VIP
- 机械制图习题集(少学时)第5五版胡建生习题答案.pdf
原创力文档

文档评论(0)