频率概率次数-西安交通大学.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
频率概率次数-西安交通大学

* 当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。 * * 中心极限定理:概率论中讨论随机变量和的分布以正态分布为极限的一类定理。 令 为从有有限均值 和方差 的任意分布中取出的随机样本。当n增大时, 样本方差的分布 当X是正态独立同分布变量,S2服从卡方分布。 若n个相互独立的随机变量ξ1,ξ2,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和∑ξ2i构成一新的随机变量,其分布规律称为χ2(n)分布,其中参数 n 称为自由度 T分布 如果总体σ是未知的,常用样本标准差s作为σ的估计值。 构造新的随机变量 F分布 F是两个独立分布除以它们相应自由度的比率。 用于比较样本方差。 小结 对于从任意分布中抽取出的样本,标准样本均值当n增加时,趋于N(0,1)。 在正态情况下,t分布的标准样本均值在分母中用S代替?。 n个单位正态变量的平方和是Chi-square(n)。 在正态情况下,样本方差服从标准化后的卡方分布。 对于正态情况,两个不同样本的方差除以对应自由度之间的比例服从F分布。 推论统计的数学逻辑 最基本的数学假设: 样本必须来自需要推论的同一总体。 样本是由回置式简单随机抽样得到的,且假设抽取的每个个体都参与了完整的调查,即抽样的完成率是100%。 只考虑抽样误差,而不考虑非抽样误差,忽略了调查的系统误差对效度的影响。抽样误差是由于总体中每个个体的差异性,以及样本大小造成的样本与总体之间的差异。抽样误差是随机产生的,无法避免,但可以通过增大样本量,抽取同质性强的样本来减小这一误差。 推论统计的数学逻辑 假设已知总体的分布,例如:假设总体符合正态分布,假设误差呈正态分布且各组方差相等,用样本统计量来估计或检验总体参数值。这类统计方法称为参数统计。大多数参数统计要求定距变量。 我们对总体情况的推论往往是描述从样本数据中计算一个按照预先给定概率来包含未知总体参数的范围,这个范围的不确定程度是来自抽样误差。置信区间就是由样本均值估计总体均值时抽样误差的范围。“一个参数落在0.45和0.55间的概率是99%这种说法是不正确的”,表示的含义是进行1000次独立重复概率抽样,会得到1000个估计参数值的区间,其中包含参数值的约有990次,表明这990次估计是可靠的;不包含参数值的约有10个,得到这种错误估计是由于抽样误差造成的。 实际上,大多数情况是总体分布未知或无法确定,这时做统计分析常常不是针对总体参数,而是针对总体的某些一般性假设(如总体分布)。我们称之为非参数统计。非参数统计方法可用于定类或定序变量。 一个正态分布中的50个样本,95%置信区间 关于对Likert 量表的设计和分析: 对态度程度的测量 关于“不一定”:存在随意设计中间项描述的情况。“不清楚”“不知道” 关于量表分级(五刻度,七刻度):一项最近的实证研究指出,5等级、7等级和10等级选项的数据,在简单的资料转换后,其平均数、变异数、偏态和峰度都很相似。Dawes, John (2008). “Do Data Characteristics Change According to the number of scale points used? An experiment using 5-point, 7-point and 10-point scales”. International Journal of Market Research 50 (1): 61-77. 量表分析 看做连续变量还是类别变量?(增加分级) 作为类别变量可以使用的分析方法:中位数或众数(平均数),四分位距(标准差),非参数检验:卡方检验,Mann-Whitney test, Wilcoxon signed-rank test, Kruskal-Wallis test。 连续变量:alpha分析,聚类分析,因子分析。 量表的缺陷? 每个人的标准不同 对每个选项的加以解释 假设检验 假设检验的目的是用样本数据来检验带有反驳项的命题的有效性。 什么叫结果的显著性?英文中显著性(significance),significance在这里不是指“重要的”。在概率中,“一个结果是很显著的”,其含义是指“这个结果很可能是真实的,而不是偶然出现的”。显著性用p值表示。 显著性检验的一般步骤如下: (1)根据实际问题的要求,提出原假设H0及备择假设H1; (2)在假设H0成立的前提下,根据所检验的统计量的抽样分布,计算样本统计量发生的概率,并给出用来拒绝或接受原假设的概率标准(显著水平)α; (3)根据“小概率事件不发生”的假设,判断是拒绝还是接

文档评论(0)

wangyueyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档