数据挖掘概述课稿.ppt

* * 遗传算法 遗传算法(Genetic Algoritms,简称GA)是以自然选择和遗传理论为基础,将生物进化过程中“适者生存”规则与群体内部染色体的随机信息交换机制相结合的搜索算法 ; 遗传算法主要组成部分包括编码方案、适应度计算、父代选择、交换算子和变异算子。 * * 序列模式 是指在多个数据序列中发现共同的行为模式。 通过时间序列搜索出重复发生概率较高的模式。这里强调时间序列的影响。 例如,在所有购买了激光打印机的人中,半年后80%的人再购买新硒鼓,20%的人用旧硒鼓装碳粉; 在所有购买了彩色电视机的人中,有60%的人再购买VCD产品 ; 在时序模式中,需要找出在某个最短时间内出现比率一直高于某一最小百分比(阈值)的规则。 * * 贝叶斯 贝叶斯分类是统计学的分类方法,其分析方法的特点是使用概率来表示所有形式的不确定性,学习或推理都用概率规则来实现; 朴素贝叶斯分类:假定一个属性值对给定类的影响独立于其他属性的值; 贝叶斯网络:是用来表示变量间连接概率的图形模式,它提供了一种自然的表示因果信息的方法,用来发现数据间的潜在关系。 * * 支持向量机 支持向量机(Support Vector Machine, SVM)建立在计算学习理论的结构风险最小化(SRM)原则之上。其核心问题是寻找一种归纳原则,以实现最小化风险,从而实现最佳的推广能力。而且SVM一个重要的优点是可以处理

文档评论(0)

1亿VIP精品文档

相关文档