- 8
- 0
- 约5.54千字
- 约 33页
- 2018-06-30 发布于福建
- 举报
第2 从数理统计到数据挖掘
第2章 从数理统计到数据挖掘 数理统计和数据挖掘有着共同的目标,即发现数据中的结构 。但数据挖掘不是数统计的分支 ,因为数据挖掘还应用了其它领域的思想、工具和方法,尤其是计算机学科,例如数据库技术和机器学习,而且它所关注的某些领域和统计学家所关注的有很大不同。因而需要逐个考察这两门学科的性质,区分它们的异同,并关注与数据挖掘相关联的一些难题。 2.1.2数据挖掘的性质 计算机使得传统统计模型的视野大大地扩展了,还促进了新工具的飞速发展 。数理统计很少会关注实时分析,然而数据挖掘问题常常需要这些 ,数据挖掘者也不可持完全非统计的观点,尽管数理统计主要关注的是分析定量数据,数据挖掘的多来源意味着还需要处理其它形式的数据。特别地,逻辑数据越来越多。 2.1.3 从数理统计到数据挖掘 数据挖掘有时候不是一次性的实验,尽管数据集是确定的,它更应该被看作是一个不断迭代的过程。从一个角度检查数据可以解释结果,以相关的观点检查可能会更接近规律。关键是,极少情形会知道哪一类模式是有意义的。数据挖掘的本质是发现非预期的模式-同样非预期的模式要以非预期的方法来发现。 2.2数理统计与数据库技术的结合 数据挖掘技术从一开始就是面向应用的,它不仅是面向特定数据库的简单检索查询调用,而且要对这些数据进行微观及宏观的统计、分析、
原创力文档

文档评论(0)