离散化算法统一框架与软件平台-计算机技术专业论文.docxVIP

  • 6
  • 0
  • 约3.58万字
  • 约 47页
  • 2019-06-05 发布于江苏
  • 举报

离散化算法统一框架与软件平台-计算机技术专业论文.docx

摘 要 随着计算机技术的发展,数据的信息量正在以指数形式增长。要想从海量、复杂的 信息中提取出有价值、有意义的数据就离不开数据挖掘和机器学习。绝大多数的数据挖 掘方法只能处理离散属性的数据,而现实中需要处理的数据中包含了许多连续属性,对 于连续属性的离散化研究就显得意义重大。大数据时代的到来,更加催化了连续属性离 散化算法的研究。离散化算法发展至今已经有了很多优秀的算法,从不同的侧重点、不 同的技术支持、不同的处理对象等可以将其划分为不同的种类。现在还没有一种离散化 算法,可以在不同的领域、不同的数据集中都能得到理想的结果。为了实现对不同的数 据集都能找到合适的离散化算法,本文的主要工作就是搭建离散化算法统一框架与软件 平台,主要的研究成果和内容如下: 首先,因为不存在通用的离散化算法,所以要实现更多的离散化算法,多实现才能 够多选择。本文对每一个离散化算法按照离散化的处理流程,把算法分解为断点的求解、 断点重要度的求解、最终断点集(归并和拆分),分别实现在不同的接口中。通过不同接 口的选择组合,不仅可以实现原来的离散化算法,还可以组合出新的算法,通过对新组 合算法的实验结果分析,当处理同一数据集时存在新组合的离散化算法优于原来的算 法,验证了可行性。这也是本文的创新之处。 其次,现在已经开发出了很多对连续属性离散化处理的软件,工具中集合了不同类 别的离散化算法。这些软件工具只能

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档