EXCEL和SPSS在回归分析正交试验设计和判别分析中的应用.docx

EXCEL和SPSS在回归分析正交试验设计和判别分析中的应用.docx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
EXCEL和SPSS在回归分析正交试验设计和判别分析中的应用

实验2指导:EXCEL和SPSS在回归分析、正交试验设计和判别分析中的应用实验目的1. 熟悉EXCEL和SPSS在数据分析中的操作;2. 使用EXCEL和SPSS进行回归分析、正交试验设计和判别分析。实验内容一元线性回归分析例:近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据资料,并想根据高校的数据决策其投资规模,数据见data.xls的Sheet1。选择数据区域B2:C11,从“插入”菜单中选择“散点图”。Excel将显示相应散点图。选择图上的点,右键菜单,选择添加趋势线,如下图所示:在趋势线选项,将“显示公式”和“显示R平方”选项打勾,如下图:结果不仅显示散点图的趋势线,还会显示相应公式,即一元线性回归的回归函数,同时显示R平方值,R即相关系数,其绝对值越接近1,表示两组数据的线性相关程度越高。一元线性回归函数描述了两组数据间存在的线性关系,在上述例子中只要知道其它高校的人数即可根据该公式预测大概的季度销售额。而R的大小能够用于度量这种预测的准确度。另外,使用EXCEL自带的函数也能实现一元线性回归:截距函数INTERCEPT功能:利用已知的x 值与y 值计算回归直线在y 轴的截距。语法结构:INTERCEPT(known_ys,known_xs) 斜率函数SLOPE功能:返回根据known_y‘s和known_x’s中的数据点拟合的线性回归直线的斜率。语法结构:SLOPE(known_ys,known_xs)相关系数函数RSQ功能:返回根据known_y‘s和known_x’s中数据点计算得出的相关系数的平方。语法结构:RSQ(known_ys,known_xs)试比较图表法和函数法计算得出的一元线性回归方程是否一致。多元线性回归分析例:一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(x1)和使用面积(x2)建立一个模型,一边对销售价格作出合理的预测。为此收集20栋住宅的房地产评估数据(data.xls的Sheet2)。由于本问题有两个自变量,因此需要使用多元线性回归,需要借助于Excel的数据分析功能。点击“数据分析”,跳出回归分析对话框;填充应变量y和自变量x1,x2对应的区域和输出区域,如下图:点击确定后将出现多元线性回归的结果,对于结果(如下图a,b,c)的一些重要项解释如下:图a图b图c图b中的Significance F及线性回归的p value,该值小于0.05表示此线性回归结果显著,及回归方程可信,房地产的销售价格与地产估价和使用面积是有关系的。图c中的Coefficients为回归方程的系数,因此,回归结果为y=—285.0094+1.5598x1+03145x2,在使用面积不变的情况下,地产估价每增加1万元,房产销售的平均价格就会提高1.5598万元;在房地产估价不变的条件下,使用面积每增加1平方米,房产销售的平均价格就会提高0.3145元;图a中Adjusted R Square为调整复测定系数,本例中约为0.71,它表示两个变量x1,x2对导致结果y的贡献,也就是说还有导致结果y的原因中有29%是由除了x1,x2以外的因素造成的。习题:在黄芪提取工艺的研究中,选择了前煮时间、煎煮次数和加水量进行考察,实验数据见data.xls的Sheet3,试对实验数据进行多元线性回归,对结果进行讨论。logistic回归分析质量性状(qualitative character)是指能观察到而不能直接测量的,只能用文字来描述其特征的性状,如食品颜色、风味等等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理。例如:是否抽烟,是否患病。采用线性回归分析显然不太合适,而logistic回归能较好地解决质量性状分析的问题。例:我们有一组数据,45个观测值,四个变量,包括:age(年龄,数值型);vision(视力状况,分类型,1表示好,0表示有问题);drive(驾车教育,分类型,1表示参加过驾车教育,0表示没有)和一个分类型输出变量accident(去年是否出过事故,1表示出过事故,0表示没有)。我们的目的就是要考察前三个变量与发生事故的关系。数据见data.xls的Sheet4.3.1 计算优势比优势(odds)是指某影响因素控制在某种水平时,事件发生率与事件不发生率的比值,即P/(1-P)。某影响因素的两个不同水平的优势的比值称为优势比,如某影响因素的一个水平为c1,另一个水平为c0,则这两个水平的优势比为:例如:吸烟与食管癌关系的病例对照调查结果。结果吸烟不吸烟合计食管癌患者309(a) 126(b) 435 非食管癌患者208(c) 243(d) 451 合计517(a

您可能关注的文档

文档评论(0)

2017ll + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档