登革热创新实验报告.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
登革热创新实验报告

数学与计算科学学院创新性实验结题报告书实验题目:登革热发病率隐藏的统计分析 实验成绩(教师填写):学 院: 数学与计算科学学院 专 业: 统计学 组 长:薛亚妮 1400720218小组成员: 谭建军1400720214 指导教师: 祝光湖老师 一、实验目的及主要创新性点1.1目的:自变量和因变量之间没有严格的、确定性的函数关系,回归分析的可以设法找出最能代表它们之间关系的数学表达形式。利用统计学中的回归分析来揭1.2创新点:把有实际意义的数值与统计方法相结合,通过多元回归分析理解它的应用。二、实验要求1、了解统计分析 2、会具体应用线性回归分析 3、学会分析统计结果,具体要求可细分为:(1)找出广东省各个区影响登革热发病的因素及与之相关的社会、经济和人口等因素;(2)进行各种回归分析,如用多元线性回归分析对数据进行处理;(3)通过回归分析,获得导致登革热病发的关键因素。三、实验原理3.1多元线性回归基本理论与概述由于事物之间的联系经常是多方面的,一个因变量的变化往往受到多个自变量的影响。由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。多元线性回归是一种数理统计方法。设因变量为y,自变量为x,自变量有p个, 它们的组观测值为.其多元线性回归表达式为:写成矩阵形式为 :是多元线性回归方程的回归系数。现实生活中,我们常会遇到含有多个自变量的问题,经常要同时考察多个自变量对一个因变量的相关度,如在对广东省21个市登革热发病率隐藏的统计分析中 ,我们会发现各个市的总人口数、农村人口、相对湿度、年降雨量、年平均温度、年平均温度、城镇化比例、经济数据(GDP)、人口密度等都会对登革热发病率产生影响。这就是多个自变量影响一个因变量的情况。在实际问题中,这种考察多个自变量与一个因变量的依赖关系的问题是大量存在的,在地质学、生物学、环境学等各种领域中也会碰到类似的问题,多元线性回归是多元统计分析中的一个重要方法。3.2多元线性回归模型的建立为了探究我国广东省21个市在2004~2014期间影响登革热的发病因素,我们收集了这几年广东省的患登革热病例数,并在统计局与气象网等收集了各市2004~2014年期间的总人口数量、农村人口、相对湿度、年降雨量、年平均温度、年平均温度、人口密度、城镇化比例、经济数据(GDP)这几个因素的数据,利用统计学的多元线性回归分析来揭示数据隐藏的关系,找出导致登革热发病的因素。2.2自变量的选取登革热病例数与总人口数量、农村人口、相对湿度、年降雨量、年平均温度、城镇化比例、经济数据(GDP)、人口密度等多种因素相关。我们取这些因素作为自变量。3.3模型的检验原理统计检验是由统计理论决定的,目的在于检验模型的统计学性质。它是运用数理统计的方法,对方程进行检验、对模型参数估计值的可靠性进行检验主要包括拟合优度检验、方程显著性检验、变量显著性检验等。在多元线性回归模型中,为了了解回归模型是否符合变量之间的客观规律需要对回归模型进行检验,以确定预测结果的可信程度。R检验与F检验都是将所有的自变量作为一个整体来检验它与因变量的相关性程度以及回归效果。3.3.1拟合优度检验(R检验)为了检验肺结核发病率的多元线性回归方程与数据的拟合程度,我,们采取拟合优度检验的方法来说明拟合优度检验方法是构造一个可以表征拟合程度的指标。定义为:总变差平方和是各个观察值与样本均值之差的平方和,反映了全部数据之间的差异;残差平方和是总变差平方和中未被回归方程解释的部分,由解释变量中未包含的一切因素对被解释变量的影响而造成的;回归平方和是总变差平方和中由回归方程解释的部分。称为复可决系数,在实际预测时,首先根据选定的检验水平A查表得到相关系数的临界值RA,要求R\RA;如果RRA,则预测结果不能使用。3.3.2方程显著性检验(F检验)解释自变量与肺结核发病率之间的线性关系,我们计算统计量的值来说明总体上被解释变量与所有解释变量之间的线性关系是否显著。F变量定义为:即统计量服从以( n,n-1-k) 为自由度的分布,其中n为选取数据的组数k为回归方程的自由度通过查询分布统计表,我们便可以得出在特定显著度的条件下检验的临界值当统计量的值大于临界值时,即可认为在总体上,自变量与 肺结核发病率呈显著的线性关系,即回归方程中所含有自变量足以解释因变量的变化存在,若FFA,则认为线性回归方程显著不成立。3.3.3变量显著性检验(T检验)通过 T检验我们可以看出每个自变量对因变量的影响,T检验则是t统计量对所有回归模型的每一个系数逐一进行检验,对于给定的检验水平,

文档评论(0)

gangshou + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档