- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学的概念:收集、整理、分析和显示统计数据的科学
统计学产生和发展的三个源头:
威廉· 配第的《 政治算术》约翰· 格朗特的人口统计学古典概率论
统计学的分科
描述统计学和推断统计学
理论统计学和应用统计学
统计数据的来源
间接获取,直接获取:普查、抽样调查
抽样调查的特点:经济性、时效性、适应面广、准确性高等
类型:简单随机抽样、分层抽样、系统抽样、整群抽样
非抽样误差及其特点:是由于调查过程中各有关环节工作失误造成的,包括:
调查中填报错误、抄录错误、汇总错误、不完整的抽样框、不回答等导致的误差,以及有意瞒报或低报造成的误差。
从理论上看,这类误差是可以避免的
抽样误差及其特点:抽样误差是利用样本推断总体时产生的误差。
特点:
对任何一个随机样本来讲都是不可避免的;
是可以计量的,并且是可以控制的;
样本的容量越大,抽样误差就越小;
总体的变异性越大,抽样误差也就越大
离散系数
标准差与其相应的均值之比
计算公式为
对数据相对离散程度的测度
消除了数据水平高低和计量单位的影响
用于对不同组别数据离散程度的比较
离散系数是从相对的角度观察差异和离散程度的,在比较相关事物的差异程度时,较之直接比较标准差要好些。
分布偏态的测度
对于未知的分布,不仅要掌握数据的集中趋势和离散程度,还需要知道数据分布的形状是否对称、偏斜的程度以及分布的扁平程度。
偏态:是对分布偏斜方向及程度的测度。
随机事件:每次试验中,可能发生也可能不发生,而在大量试验中具有某种规律性的事件,简称事件。
事件:试验的结果称为事件
概率的三种定义:古典、统计、主观
概率的运算法则:加法法则、乘法法则
事件的独立性:两个事件独立即,一个事件的发生与否并不影响另一个事件发生的概率
抽样分布:就是由n个观察值计算的统计量的概率分布
样本均值的抽样分布:当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值`x也服从正态分布,`x 的数学期望为μ,方差为σ2/n。即`x~N(μ,σ2/n)
中心极限定理:设从均值为m,方差为s 2的一个任意总体中重复地抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布
t分布:在样本均值x的抽样分布中,如果总体标准差s未知,则只好用样本标准差s代替,这时样本均值x的抽样分布则服从自由度为(n-1)的t分布。
参数估计:用样本统计量去估计总体的参数
估计量:用于估计总体参数的随机变量
抽取了1000个样本,根据每一个样本均构造了一个置信区间,这样,由1000个样本构造的总体参数的1000个置信区间中,有95%的区间包含了总体参数的真值,而5%的置信区间则没有包含。这里,95%这个值被称为置信水平(或置信度)。
一般地,将构造置区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平。
评价估计量的标准:无偏性,有效性,一致性
假设检验:也称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。
假设的两种类型:原假设,备择假设
检验中的两类错误:
第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设
第Ⅰ类错误的概率记为?被称为显著性水平
第Ⅱ类错误(取伪错误)
原假设为假时未拒绝原假设
第Ⅱ类错误的概率记为??(Beta)
拒绝域:能够拒绝原假设的统计量的所有可能取值的集合。就是由显著性水平?所围成的区域。
临界值?根据给定的显著性水平确定的拒绝域的边界值。
P值:如果原假设H0为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值,也称观察到的显著性水平。
反映实际观测到的数据与原假设H0之间不一致的程度
指数的概念:指数是一种对比性 的分析指标,是研究对象在不同时间,或者不同空间,或者还可以是实际和计划的对比分析。
指数的分类:
总指数的编制方法:综合指数法和平均指数法
综合指数法的不足之处:不同商品的数量和价格不能直接加总,明显受到计量单位的影响
平均指数法不足之处:没有考虑不同商品的重要性程度。编制价格指数的目的之一是考察价格变化对货币支出的影响。
基本问题是:合理加权
文档评论(0)