(用)第七课多元统计分析概要.doc

(用)第七课多元统计分析概要

数据挖掘 十大经典数据挖掘算法是那些?  数据挖掘十大经典算法可以分为以下情况。  1 与分类相关的算法:C4.5, CART(分 类与回归树), Na?ve Bayes(朴素贝叶斯, K 近邻, 支持向量, 最大期望, AdaBoost;  2 与聚类相关的算法: K均值3 与关联规则相关的算法:Apriori4 与搜索引擎相关的算法:PageRankMASS包:library(MASS)) lda(formula, data, ..., subset, na.action) qda(formula, data, ..., subset, na.action) 参数formula为公式,形如groups~x1+x2+…, data为数据构成的数据框,subset为可 选择向量,表示观察值的子集,na.action为函数,表示处理缺失数据的方法。 lda( )函数的返回值有:调用方法、先验概率、每一类样本的均值和线性判别系数,qda( )函数的返回值与lda( )函数的返回值相同,只是没有线性判别系数,因此,无论预测还是回代,还需要有预测函数predict( )函数。 对于lda( )函数而言,predict( )函数的使用格式: predict(object, newdata , prior = ob

文档评论(0)

1亿VIP精品文档

相关文档