连续值的离散化.pdfVIP

  • 64
  • 0
  • 约1.07万字
  • 约 10页
  • 2017-05-03 发布于湖北
  • 举报
连续值的离散化

连续值的离散化 许文烈 成均馆大学 1、为什么要进行离散化? 1.1 什么是连续属性离散化 连续属性的离散化就是在特定的连续属性的值域范围内设定若干个离散化 的划分点,将属性的值域范围划分为一些离散化区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值。对连续属性的离散化过程,从本质上来看, 就是利用选取的断点来对条件属性构成的空间进行划分的过程。 1.2 连续属性离散化的目的 连续值离散化的目的是为了简化数据结构。 数据通常有这样几种类型:标称型,离散型和连续型。现实生活中的数据往 往来源于复合型,例如许多数据是数值型与离散型的复合。这就需要有一个统一 的数据类型来进行数据处理。 通过将属性值域划分为区间,数据离散化技术可以用来减少给定连续属性值 的个数。离散属性比连续属性更接近于知识级的表达。对用户和专家而言,离散 属性更易理解、使用和解释。 离散化方法经常作为数据挖掘的工具,而使用离散属性所获得的结果(决策 树、归纳法则)往往更紧凑、简短和精确因此其结果也更易被检查、比较、使

文档评论(0)

1亿VIP精品文档

相关文档