- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计量经济学与应用
3. 数据与检验
本章内容
变量关系与研究方法
数据统计概述
描述性统计
数据的分布与推断性检验
数据类型与相关关系
数据统计概述
一些概念
总体(population): 打算研究的全部个体 ----大同小异
样本(sample): 总体中,具有代表性的一部分
随机化(randomization): 使样本具有代表性的重要方法
参数: 定量反映总体的某个性质 通常用希腊字母表示,如 μ,π ---- 常常未知
统计量:定量反映样本的某个性质通常用拉丁字母表示,如 s, p
数据统计概述
总体率由样本率估计
例如,设样本的个体数(即样本含量)为n,若x为样本的某指标阳性个体数,则可用样本阳性率 估计研究人群的阳性率 (总体阳性率);
由于个体差异和偶然性的影响,样本率也存在抽样误差---由抽样造成样本率与总体率(研究人群的率)的差异
样本率是随机的,但在概率意义下也是有规律的---样本率的分布。
统计分析
统计分为描述性统计和推断性统计。描述性统计主要是对一字数据进行概述和描绘。推断性统计是通过检测部分(称为样本)从而得到对整体(称为总体)的一般性认识的过程。为使这种推断有效,样本对总体而言必须具有代表性,且必须设定误差概率。
描述性统计是用一组两组反应整体数据特征的信息来对改组数据予以描述。他同事也指用表、图、图形以及其他的图形表达形式来描述一组数据。
推断性统计(含估计和假设检验)是指从一个取自全体的样本的特殊性得到有关总体的一般性特征。因此推断性统计相当于归纳推理(恰与由整体特征得出个体特征的演绎推理相反)
统计分析通过利用相关经济数据及评估结果,为估计经济变量之间不精确、不能通过实验获得的经济滚系提供适当的技术支持。
变量类型
定性变量
分类变量(categorical variable)或名义变量(nominative variable)。
分类变量的水平(level) :代码(code) 用1、2、3、4、5等来表示各个水平。
二分类变量(binary variable), 也称0-1变量或假变量(dummy variable)
有序变量(ordinal variable) 种种可能的“取值”中自然地存在着次序。
变量类型
定性变量
离散型变量 只能取整数值。
例如,手术病人数; 新生儿数
连续型变量 可以取实数轴上的任何数值。由测量而得到的大多属于连续型变量。“连续”: 指该变量可以在实数轴上连续变动。
例如,血压、身高、体重等
变量转化
只能由高级向低级转化, 不能作相反方向的转化
连续型→有序→分类→二值
描述性统计
频数表和直方图
平均水平度量
变异性度量
相对数
频数表与直方图
描述样本特征,直观反映概率分布
频数表-连续型变量/离散型变量
直方图
直方图,是一种二维统计图表,它的两个坐标分别是统计样本和该样本对应的某个属性的度量。
离散型变量—直条图
连续型变量--- 直方图
平均水平的度量
算术均数 直方图接近对称时用
几何均数 对数值的直方图接近对称时用
中位数 直方图单蜂而不对称时用
当 n 为奇数, 中位数= 第 (n+1)/2 个数值
当 n 为偶数, 中位数= 第n/2个数值+ 第 (1 +n/2)个数值2
变异性度量
变异性度量
相对数
1、均值
最常用的变量取值的集中趋势测度(mean).
变量X的均值为:
2、方差和标准差
最常用的变量取值的离散测度是方差(variance)及标准差(standard deviation).
方差:
标准差:
3、协方差和相关系数
变量X和Y有n对数据(X1,Y1), (X2,Y2), …,
(Xn,Yn)。
X和Y的观测值相关程度的一个测度是协方差(covariance).
更常用的是相关系数(correlation coefficient)
其中Sxy是X和Y的协方差,Sx和Sy分别是X和Y的标准差。
五、几个重要的理论概率分布
正态分布,t分布, 2分布和F分布。
1、正态分布
正态分布是最著名的一种分布,其图形为钟形。概率密度函数具有以下形式:
其中μ和2分别是该分布的均值和方差。若X服从均值为μ,方差为2的正态分布,可用符号表示为X~N (μ, 2)
17
正态分布有以下性质:
(1)关于均值对称,如图所示。
18
(2)正态曲线下大约68%的面积位于μ±之间,大约95%的面积位于μ±2之间,大约99.7%的面积位于μ±3之间。
(3)正态分布完全被它的两个参数μ和 2所确定。
X~N(μ, 2) ,令Z =(X-μ)/则Z~N (0,1)即Z服从均值为0,方差为1的标准正态分布。
您可能关注的文档
最近下载
- 建筑工程图集 11SG814:建筑基坑支护结构构造.pdf VIP
- 电商平台客户投诉处理协调配合措施.docx VIP
- 快速心律失常的急诊处理PPT课件.ppt VIP
- 标准图集-新型城镇化-智能灯杆.pdf VIP
- 11SG814 建筑基坑支护结构图集.docx VIP
- 2024年11月江苏苏州市中医医院(西苑医院苏州医院)招聘编外人员笔试笔试历年专业考点(难、易错点)附带答案详解 .doc
- 广西壮族自治区家庭经济困难学生认定申请表.doc VIP
- 大闽食品(漳州)有限公司企业标准.doc VIP
- 施工企业安全生产事故报告及处理制度.docx VIP
- 电商平台纠纷处理与客服投诉管理方案.docx VIP
文档评论(0)