- 7
- 0
- 约8.84千字
- 约 12页
- 2017-01-08 发布于重庆
- 举报
1:数据挖掘技术选型研究
数据挖掘的基础理论定义狭义的定义:数据挖掘是知识发现(KDD)过程中的一个特定步骤,是用专门算法从数据中抽取模式,然后通过解释和评价转换成最终用户可理解的知识一般定义:数据挖掘是从大量的、不完全的有噪声、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的以及最终可理解的模式的过程数据挖掘的目地预言(Predication):用历史预测未来描述(Description):了解数据中潜在的规律数据挖掘的一般过程数据收集:通过各种方式广泛收集用户的信息,建立必要的数据库与数据表,为数据挖掘做准备。数据处理:对收集到的信息进行诸如去噪等操作,从而确保数据能够真实反映待要挖掘的对象。数据变换:将经过去噪的数据进行一定的格式转换,使其适应数据挖掘系统或数据挖掘软件的处理要求数据挖掘:利用挖掘方法对数据进行分析,挖掘出需要的各种规则、趋势、类别、模型等模式评估:对发现的规则、趋势、类别、模型进行评估,从而保证发现的模式的正确性知识表示数据挖掘的理论模型分类模型发现自动分类:根据训练数据集和类标号属性,构建模型来分类现有数据,并用来分类新数据;自动分类方法:决策树:决策树是将特征的判别序列形成一颗树,从树根到叶子节点进行每个节点的判断,叶子节点处对应某个类别标号,就是最终的分类结果。决策树分类的关键是树的构造,由每个节点引申每个属性的判别分支。如何选择特征属性的判别顺序?一种方法是利用每个特征对
原创力文档

文档评论(0)