2017人民大学多元统计附的答案.docxVIP

2017人民大学多元统计附的答案.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2017人民大学多元统计附的答案

多元统计大数定律:切比雪夫大数定理,伯努利大数定理,辛钦大数定理(最常用)辛钦大数定律:设为独立同分布的随机变量序列,若的数学期望存在,则服从大数定律:即对任意的ε0,有公式三:中心极限定理:从均值为u,方差为sigma方的总体中任意抽取样本量为n的样本,当样本量充分大的时候,样本均值X-bar服从均值为u,方差为n分之sigma方的正态分布;格力文科定理:当n相当大时经验分布函数是总体分布函数的一个良好近似变量值:从一次观察到另一次观察呈现差别或者发生变化的某种特征(变量)随机变量:随机试验结果数量化;变量按照随机规律所取的值?分布:统计学的核心概念随机变量的分布:随机变量的所有取值,以及其对应的概率的一揽子表示;包含两个意思,第一,随机变量的每个取值都包含在内,第二,取值对应的概率都包含在内;随机变量的分布:总体分布:??样本分布:??抽样分布:??参数:总体的某种特征,是我们所关心的感兴趣的,或者要研究的总体的某个或者某些方面的数量表现;总体:所有个体的集合称为总体,个体规模N样本:被抽中的个体称为样本,对应的规模是样本量n总体均值问题:凭什么用样本均值估计总体回答:因为总体均值是变量,但不是随机变量,它由随机变量来确定,也就是有样本均值会服从以总体均值为期望的~~~分布(就是中心极限定理)为什么服从t分布??d和alpha和n和N的关系:公式见书上1-f:n和N的关系∑与s的关系问题:为什么不用小∑,用s回答:因为∑未知均方误和其估计的异同?R^2相当于y-hat和y的相关系数?P(AB)-P(A)*P(B)=距离??Spearman和pearson相关系数的等价性?施密特变换和主成分变换的异同??随机抽样:抽取样本的时候,总体中每个个体都有同等机会选入样本中随机样本:从总体中随机抽样得到的样本;随机试验:?随机试验:条件试验可以重复进行;试验的所有可能结果事先是知道的;每一次试验之前无法预知结果(这是随机的本质性质)所有的试验结果用一个变量表示,每一种试验结果都对应一个变量值;一个变量值只是一种试验结果的记号或代码; “随机试验=随机抽样”的原因:由于变量值只有在抽样后的调查才能获得,所以显然不能认为试验的所有可能结果已知,不能满足设计实验三个条件中的第二个;因此随机试验结果只能理解为样本(受查客体的集合),于是实验只能理解为随机抽样尤其是简单随机抽样;简单随机抽样:就是一个典型的随机试验,N中抽取n,依不放回抽样方式一举从中抽取n个个体构成一个样本,若将其看成实验,则完全满足随机试验的三个条件;其中,“可重复”这个条件是在理想进行,所有条件环境均可严格控制;随机试验之结论变量值不是试验的直接结果,而是随机抽样的连带结果;正因此变量值才可以合理的被当作是随机实验结果。而所有实验结果才能可以用随机变量来概括反映;变量值是随机变量,一定是因为变量值是从随机抽样调查中取得的;随机性仅仅来源于随机抽样;实体与属性:概念:实体:人们能清晰感知其边界范围的客观存在属性:是实体的组成构建或者附在其上的性质,可以区分此实体与不同类的实体,也可以区分与同类的其他实体;关系:属性不能离开实体,不同实体的区分借助属性实现;多个属性组合在一起的组合体就是实体描述实体的特征称为属性意义:一个属性值对应一个个体,而属性值可以对个体分类或者作为个体的一种标识,所以随机试验结果可以用随机变量表示;??概率个体承载试验结果,不同个体对应相同试验结果;存在两种概率解释:个体是等概率的;变量值可能等概率可能不等概率;变量值的概率=对应该变量值的个体数/总体全部个数某一变量值的频率=对应该变量值的个体数/样本全部个体数估计:根据取自总体的样本的统计量来推断或评价总体参数的过程描述统计学:分布+分布特征样本分布+样本分布特征总体分布+总体分布特征推断统计学:样本分布特征总体分布特征样本分布总体分布样本分布特征总体分布特征总体分布多元统计核心:降维,描述,推断分布的表示方法:文示法:以文字表述,简单表示法:以表格陈列,较复杂图示法:以图形展示,复杂分布特征:几何特征:?集中趋势,离散程度代数特征:?数字特征?均值,方差等抽样误差??误:相对真值而言,总体分布特征而言差:相对均值而言联合分布边缘分布条件分布条件条件概率条件期望多元统计的框架:自变量分类+因变量分类:列联分析、对应分析自变量分类+因变量数值:方差分析、联合分析自变量数值+因变量分类:判别分析,逻辑回归自变量数值+因变量数值:回归分析,结构方程列联分析:公式最终类类相关系数:Pearson列联系数Cramer关联系数Cramer修正关联系数方差分析:公式分类对数值的相关关系:A=组间差/(组内差+组间差)总平方和=组间平方和+组内平方和公式:对比回归分析:证明:两种组间平方和的关系.关键词:多类,每

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档