网站大量收购闲置独家精品文档,联系QQ:2885784924

532人工神经网络的基本要素.PPT

  1. 1、本文档共107页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
532人工神经网络的基本要素

例子:利用回归分析预测人寿保险公司客户寿命 人寿保险公司对预测客户寿命的长短感兴趣,因为它们的保险费和盈利水平依赖于这一数据。一家保险公司的保险精算师选取了最近去世的100位男性客户作样本,记录了客户的年龄及其祖父母、父母去世时的年龄。相关数据存储于“人寿保险公司.sav”中。 基于这些数据进行回归分析并建立回归模型; 预测一位父母的寿命都是70岁、祖父的寿命是75岁、祖母的寿命是80岁的客户的寿命(置信度为95%); 估计所有母亲的寿命是75岁、父亲的寿命是65岁、祖母的寿命是85岁、祖父的寿命是80岁的客户的平均寿命(置信度为95%)。 * * 调用SPSS主菜单的Analyze—〉Regression—〉Linear命令,打开对话框,指定因变量(客户寿命Longevit)和自变量(客户的祖父、客户的祖母、客户的父亲、客户的母亲去世时的年龄),以及回归方式:逐步回归。 * * 在Statistics栏中,选择Estimates以输出回归系数B的估计值、t统计量等;选择Durbin-Watson进行DW检验;选择Model fit输出拟合优度,F统计量值等。 * * 在Plots栏中选择Histogram绘制标准化残差的直方图;选择Normal probability plot绘制标准化残差分布与正态概率比较图;绘制残差与y的预测值的散点图,检验误差变量的方差是否为常数。 * * 提交运行,并在输出窗口中查看结果 系统在进行逐步回归过程中产生了两个回归模型,模型1先将与因变量(客户寿命Longevit)线性关系最密切的自变量MOTHER引入模型,建立它们之间的一元线性回归模型。而后再逐步引入其他变量,模型2表明又将自变量FATHER引入,建立了二元线性回归模型。可见,客户祖父母的寿命对客户寿命的影响相对较小。 回归模型概述表中给出了两个模型各自的R2和调整后的R2 。第一个模型中客户寿命中有49.3%的变异可以用客户母亲寿命的变异来解释。第二个模型中客户母亲寿命和客户父亲寿命的变异可以解释客户寿命中73.1%的变异。 两个模型都通过了F检验。此外,F统计量的值较大,t统计量的值也通过了检验,不存在严重的多元共线性问题。 * * * * 回归残差的直方图与图上的正态分布曲线相比较,可以认为残差基本服从正态分布。 * * 观测量累计概率图:纵坐标为期望累计概率分布,横坐标为观测量累计概率分布,图中的斜线对应着一个均值为0的正态分布。 如果散点密切地散布在这条斜线附近,说明残差服从正态分布。如果偏离这条线太远,应该怀疑残差的正态性。 * * 残差与y的预测值的散点图用以检验误差变量的方差是否为常数,随着 的变化,残差无明显变化,因此误差变量的方差为常数,不具有异方差性。 进行预测 在原始数据中回归模型的自变量下方输入给定的值,相应的因变量将产生缺失值; 选择主菜单Analyze—〉Regression—〉Linear,打开Linear Regression对话框。指定自变量和因变量; 单击Save按钮,选择Predicted Values栏中的Unstandardized,保存非标准化预测值在一个新变量中; 选择Prediction Intervals栏中的Mean和Individual,并在Confidence Interval框中输入置信度,保存所输入的置信度条件下y期望值和特定y值预测区间的上下; 提交运行,除了输出回归分析结果外,还将在数据文件中生成pre_1、lmci_1、umci_1、lici_1和uici_1等变量。其中,pre_1保存点预测值,lmci_1和umci_1分别保存y期望值预测区间的下限和上限,lici_1和uici_1分别保存特定y值预测区间的下限和上限。 * * 5.4.3 非线性回归 非线性回归(Nonlinear Regression Analysis)是寻求因变量与一组自变量之间的非线性相关模型的统计分析方法。 如不能确定一个适当的模型,可借助曲线估计过程预先分析,或借助散点图,直观观察变量的变化,将有助于确定一个合用的函数关系。在一般统计软件中,会提供常用的非线性回归模型,供使用者参考。 * * 练习:某研究机构为研究儿童的智力状况,调查了16所小学的平均语言测试得分(y)与家庭社会经济状况综合指标(x1)、教师语言测试得分(x2)及母亲教育水平(x3)的数据,试进行多元回归分析(linearregression2.sav)。 旅游业的经营易受季节的影响,某旅游胜地的一家旅馆记录了最近5年每个季度的入住率。旅馆经理关心下列问题: 五年来,这家旅馆的入住率是否呈现上升或下降趋势? 下一年,每个季度的入住率分别是多少? 对于这样的问题,时间序列分

文档评论(0)

ailuojue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档