医学的数据管理与——第十章2程序.ppt

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Curve Estimation: 曲线估计分析 曲线回归(估计、拟合):选定一种用函数表达曲线,使理论数据与实际数据间的差异尽可能小。 解决问题: 1 曲线模型的选择; 2 模型参数的确定。 可以经变量变换转化为线性关系,SPSS中Curve Estimation解决。 不能经变换转化为线性关系,用迭代或分段平均值等方法处理, SPSS中Nonlinear解决 基本思路:通过散点图及专业、经验等确定函数类型,再利用SPSS解决。 SPSS曲线估计中,首先,在不能明确究竟哪种模型更接近样本数据时,可在多种可选择的模型中选择几种模型;然后SPSS自动完成模型的参数估计,并输出回归方程显著性检验的F值和概率p值、判定系数R2等统计量;最后,以判定系数为主要依据选择其中的最优模型,并进行预测分析等。另外,SPSS曲线估计还可以以时间为解释变量实现时间序列的简单回归分析和趋势外推分析。 Curve Estimation中提供了11种本质线性模型: 曲线估计的基本操作 可通过绘制并观察样本数据的散点图粗略确定被解释变量和解释变量之间的相关关系,为曲线拟合中的模型选择提供依据。SPSS曲线估计的基本操作步骤是: (1)选择菜单Analyze-Regression-Curve Estimation,出现窗口如下页所示。 (2)把被解释变量选到Dependent框中。 (3)曲线估计中的解释变量可以是相关因素变量也可是时间变量。如果解释变量为相关因素变量,则选择Variable选项,并把一个解释变量指定到Independent框;如果选择Time参数则表示解释变量为时间变量。 (4)在Models中选择几种模型。 (5)选择Plot Models选项绘制回归线;选择Display ANOVA table输出各个模型的方差分析表和各回归系数显著性检验结果。 至此,完成了曲线估计的操作,SPSS将根据选择的模型自动进行曲线估计,并将结果显示到输出窗口中。 【实例】某产品零售商已知产品的广告投入和销售额的数据,试找出适当的回归方程。 【作散点图预分析】 Graphs-scatter/dot 重叠散点图,用于多对变量 三维散点图,用于三个相关变量 简单散点图,用于一对变量 矩阵散点图,用于多对变量 单点散点图,用于单个变量 设置散点标识,颜色 设置散点标签 设置栅格,行列分类分组 【散点图设置】 可见,不是非常明确,可以近似拟合直线、二次曲线及三次曲线。 【注意】若不能明确判定函数类型时,可选几种可能曲线,再利用SPSS的结果分析、判定。 【设置界面】 若选用time,则因变量数据作为时间均匀的时间序列 【结果形式】 由表中可决系数R2 可见,二次或三次曲线拟合较好,且模型检验也有统计学意义。 二次曲线方程:sales 3.903+2.854advert-0.245advert2 三次曲线方程: sales 3.283+3.471advert-0.422advert2+0.015advert3 拟合曲线: 曲线回归分析的应用举例 例10-2-7 曲线回归 二项逻辑回归 Binary Logistic 在现实中,经常需要判断一些事情是否将要发生,候选人是否会当选?为什么一些人易患冠心病?为什么一些人的生意会获得成功?此问题的特点是因变量只有两个值,不发生 0 和发生 1 。这就要求建立的模型必须因变量的取值范围在0~1之间。 二项逻辑回归 Binary Logistic Logistic回归模型 Logistic模型:在逻辑回归中,可以直接预测观测量相对于某一事件的发生概率。包含一个自变量的回归模型和多个自变量的回归模型公式: 其中: z B0+B1X1+…BpXp P为自变量个数)。某一事件不发生的概率为Prob no event =1-Prob event 。因此最主要的是求B0,B1,…Bp 常数和系数 数据要求:因变量应具有二分特点。自变量可以是分类变量和定距变量。如果自变量是分类变量应为二分变量或被重新编码为指示变量。 Logistic回归分析的应用举例 例10-2-2 Logistic回归模型 线性回归 变量多重共线性问题 多重共线性:是指自变量间存在线性相关,即一个自变量可用其他一个或几个自变量的线性表达式进行表示。导致偏回归系数存在无穷多个解或无解,出现偏回归系数难以有合乎专业知识的解释 容忍度Tol 容忍度值越接近于1,表示多重共线性越弱。SPSS变量多重共线性的要求不很严格,只是在容忍度值太小时给出相应警告信息。 方差膨胀因子VIF 膨胀因子是容忍度的倒数,越接近于1,表示解释变量间的多重共线性越弱。通常如果VIFi大于等于10,说明解释变量xi与其余解释变量之间有严重的多重共线性。 线性回归 变量多重共线

文档评论(0)

贪玩蓝月 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档