数据挖掘和分析30_W20A资料.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
习题讲解 2015.1.6 第二十周 EX3 任务描述 数据中为某个群体的7个观测量的量化值数据Y,X1~X6 编写.r代码,使之一次运行可以完成以下任务,同时输出图形、分析过程、结果(cat()) 使用多元线性回归分析找到最优的模型,由X1~X6中的部分变量解释Y 不需要考察二次项,乘积项或交互项 当两个模型拟合度相似时,如何选择? 确定最优模型的模型参数 对代码的每一句进行注释 EX3 数据模型 #y1=3.45+1.2*x1-0.67*x5+4.5*x6+rnorm(36,sd=5) #y2=12+4*x3-0.5*x4+rnorm(36,4) #y3=100+9.4*x2-7.56*x3-12.04*x5+rnorm(36,sd=9) #y4=-123-3.8*x1-8.3*x4+4.3*x6+rnorm(36,sd=3) #y5=-13-3.8*x3-6.3*x5+3.3*x6+rnorm(36,sd=3) #以上为五个数据产生的模型,对应相同标号的数据(最终只用了y1-y4),如果拟合后的结果接近,则得分 EX3 打分标准 #方法:5分 全子集回归逐步回归 #如果用逐步回归法,则需要穷尽各种组合,如果做到了,也算对,否则在方法上需要5分需要扣2分 #如果用scatterplot(探测变量之间的相关性),则无意义,可以忽略 #结果:2分 对照上面的模型 #注释:2分 注释需要文对题 #按时交:1分(如果限期后一天之内交的,算按时;否则0分) EX3 步骤 #用全子集回归方法(即把各种模型都用图表示出来)进行回归是最简单直接的方法, #画出图后,根据adjr2指标进行选择出最优的几个模型, #然后再最优的模型中选择用ANOVA来确定这几个模型不存在显著区别(正好这几个模型都是相互嵌套的模型) #所以最后选择最简单的模型(变量最少的) #最后用cat在屏幕输出fit结果 EX3 代码 data3=read.table(regdata3.csv,header=TRUE,sep=,) plot(regsubsets(y3~.,data=data3),scale=adjr2) fit1=lm(y3~x2+x3+x5) #这里是已经从全子集回归图里发现了最优的三个模型,需要逐一比较 fit2=lm(y3~x1+x2+x3+x4+x5) fit3=lm(y3~x1+x2+x3+x5) summary(fit3) summary(fit2) summary(fit3) anova(fit1,fit2) EX3 结果 EX3 结果 #Analysis of Variance Table #Model 1: y3 ~ x2 + x3 + x5 #Model 2: y3 ~ x1 + x2 + x3 + x4 + x5 # Res.Df RSS Df Sum of Sq F Pr(F) #1 32 2887.9 #2 30 2662.2 2 225.68 1.2716 0.2951 anova(fit1,fit3) #Analysis of Variance Table ## #Model 1: y3 ~ x2 + x3 + x5 #Model 2: y3 ~ x1 + x2 + x3 + x5 # Res.Df RSS Df Sum of Sq F Pr(F) #1 32 2887.9 #2 31 2686.1 1 201.81 2.3291 0.1371 期中论文 主观幸福和人力资源EAP的关系 概述 本研究选取378名上海、北京、广深一线城市及江苏、湖南、河南等地的二线城市企业在职员工作为研究对象,分别构建员工幸福感与EAP关系模型。 研究目的 验证员工援助计划(EAP)对企业员工主观幸福感提升有积极贡献 验证员工援助计划(EAP)是企业员工主观幸福感水平的影响因素之一,而且对主观幸福感不同纬度(认知、情感)的影响不同 期中论文 评分标准 数据清理 10% 缺失数据;错误数据 数据预处理 10% 合并;类型转换;增删变量 数据信度效度分析 10% 描述性统计分析 10% 相关分析 10% 两独立样本t检验(单因素方差分析) 10% 回归分析 20% 论文书写 20% 期中论文 数据清理 10% 缺失数据 删除变量 删除记录 填补缺失值 论文中说明过程、理由 错误数据 判定 措施 说明 期中论文 数据预处理 10% 合并、增删变量 牛津幸福感问卷3个测评维度:生活满意感、人际和谐感、自我效能感 EAP实施测

文档评论(0)

boss + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档