基于地方体育logistic回归分析.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于地方体育logistic回归分析

基于地方体育——logistic回归分析logistic回归分析。一般比较常用的因变量为为二项分类,我们称之为二项logistic回归分析。 logistic回归分析的主要用途: 1.?????? 寻找主要影响因素 2.??? 预测,如果已经建立了logistic回归模型,则可以根据模型,预测在不同的自变量情况下,对因变量的影响程度。 3.??? 判别,实际上跟预测有些类似,也是根据logistic模型,判断有多大的概率与因变量相符。 变量描述: 用于logistic回归的自变量可以是连续变量,也可以是不连续的,如定类变量。 1.??? 对于自变量是连续变量,要求自变量与因变量有线性关系。如果不是线性关系,则可以考虑把连续变量转为定类变量。比如说年龄和身高的关系,在青少年时期年龄和身高是递增的,但随着年龄达到一定阶段,就不再是递增了。表示年龄与身高不是线性关系了,这时可以考虑把年龄划分成年龄段来做为变量。 2.??? 二级变量,只有两个水平的变量。如性别只有男和女等等。像这种只有两个水平的变量,可以用0和1来表示。 3.??? 多级变量,指不只两个水平的变量,如文化程度包括有小学及以下、初中、高中、大学、研究生等等,对于多级变量,需要进行转换成用0或1表示,然后再引入到回归分析中。比如说上面说的文化程度可以引入四个变量X1,X2,X3,X4;小学用0,0,0,0表示,初中用1,0,0,0表示,高中用0,1,0,0表示,大学用0,0,1,0表示,研究生用0,0,0,1表示。一般来说多级变量有n个水平,则需要设计n-1个哑变量来描述。 案例分析 这里以一个问卷调查的案例来分析logistic回归分析的运用,只做文字上的讲解,通过案例来触类旁通。 武汉市体育人口形成的因素 影响体育人口形成的因素是多方面的,如人们的社会地位、文化素质、经济状况、闲暇时间等都是研究体育人口形成因素时需要考虑的方面。结合文献的研究结果,本研究选取以下7 个指标作为影响武汉市体育人口形成的因素:年龄、个人月收入、家庭人均月收入、家庭年体育消费额、文化程度、职业状况、每天家务劳动时间。 变量处理 注:表中个人月收入的分组方法为[6 ,7 ] :将居民个人月收入由低到高排序,然后将它们5 等分,从而将居民分为低收入、中低收入、中等收入、中高收入、高收入5 个组。家庭人均月收入、家庭年体育消费额、每天家务劳动时间(4 等分) 的分组方法与个人月收入的分组方法一样。 因变量判定标准 体育人口的判断标准为:每周参加3 次或3 次以上体育活动;每次活动30 或30 min 以上;每次活动强度中等以上。满足上述3 个条件的界定为体育人口, Y = 1 ,不满足上述任一条件者为非体育人口,Y = 0 。 数据来源 受武汉市体育局委托,我们于2005 年4 月1 日~30 日对武汉市体育人口进行了抽样调查。本次抽样调查采用的方法是多阶段随机抽样方法,调查的最小单元为16~70 岁的武汉市居民。具体抽样过程为:从武汉市每个行政区(共13 个行政区) 随机抽取2 个街道/ 镇(共26 个) ,从每个街道/ 镇随机抽取2 个社区/村委会(共52 个) ,从每个社区/ 村委会随机抽取100户(共5200 户) ,从每户抽取1 人作为调查对象,对所回收的5 200 份问卷进行有效性检查,最后得到有效问卷5054 份。 (后面就是对数据进行logistic回归分析,通过回归模型分析每个自变量对因变量的影响程度,不同自变量的不同水平对因变量的影响程度。由于案例来自网上,没有数据,所以后面的SPSS分析略掉,不过从本案例中也大概知道了logistic回归分析的一些应用) ? 写到这里我们也不由的联想到了t检验和卡方检验,如果是定量数据,则可采用t检验,如果是定性的,则采用卡方检验。线性回归分析与logistic回归分析也可以做差不多的理解。 ? 读书笔记越写到后面感觉越困难,一个是复杂程度已经是大幅度增加,另外也是鉴于体育统计资料方面的欠缺,有时候感觉某某分析能够用在体育什么方面比知道怎么进行SPSS处理来得更重要了。 回归分析主要用于预测,也就是每一个因变量X能给因变量Y带来多大的影响. 1) 多元线形回归分析图示: 在回归分析中,若自变量不是连续变量,则需要把自变量转化为虚拟变量(哑变量) 2)logistic回归分析 在回归分析中,若因变量不是连续变量,而是二分类变量或二次序变量,则用logistic回归分析 4)? 因变量为多分变量或多分次序变量 在上面说的各种统计方法中,若因变量为连续变量,则一般要求:总体服从正态分布,方差齐。当然在实际过程中也不是绝对。 在样本量的要求方面不同的统计方法也会有不同的要求。

文档评论(0)

2017ll + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档