- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[数学]也谈统计建模中的因果关系20121112
也谈统计建模中的因果关系
徐映梅
统计与数学学院
yingmeix@163.com
因果与相关的几个例子
研究因果关系的方式:实验研究与观测研究
统计学关于因果推断的统计方法
列联分析
基于相关的回归
横截面回归
时间序列分析
面板数据分析
路径分析
结构方程模型
提纲
因果关系
在控制其他因素不变的条件下,作为原因的变量通过某种机制影响作为结果的变量。
相关关系
一个变量的变化伴随着另一个变量的变化,这两个变量表现为相关关系。可以用相关系数衡量。
简单相关、偏相关和复相关
两个不同的重要概念:因果与相关
小学生的阅读能力与鞋子的尺寸大小相关
甲与乙两人手表的时间高度相关
几个例子:虚假相关
打太极拳与身体健康---因果
铀影响身体健康---因果
吸烟与肺癌发生率---因果
虚假独立性
“观察与实验的区别在于观察向我们提供的知识似乎是自己呈现出来的;而实验向我们提供的知识则是为了知道事实是否如此而进行某种试探的果实。”(Zimmermann,论医学上的实验, 1774)
“观察是一种用于搜集事实的研究方法,而实验则是一种获得知识的手段。”(Bernard,实验医学研究导论,1920)
研究因果关系的方式:实验研究与观察研究
Holland(1986)指出:如果没有不可检验的假定的话,因果推断是不可能的。
如果不进行随机化实验,或者没有检验不可证伪的假定的话,就不可能由数据的统计分析得出因果结论。
设计可检验的假定
随机化实验是评估因果作用的最好的科学方法。
但许多研究是禁止使用随机化实验,甚至禁止使用实验方法,而仅能进行观测研究。
例子
关于吸烟与肺癌的流行病研究。
开车时打手机是否增加事故发生率?
在不能应用随机实验的情况下,对照研究试图寻找一个与处理组可以比较的对照组,进行因果推断的实验研究。只是处理不同,而其他方面相近的样本组成研究对象。
现实中如何变通?
同一时期内不同个体特征的样本数据集,该样本一般通过随机抽样获得。
对于检验微观经济假设和评价经济政策,给定时点上个人、家庭、企业、城市的数据都至关重要。
观测值排序没有意义
数据结构
年龄 受教育程度 工资水平 工作经历
Case1
Case2
Case3
………
市场研究与经济活动的现实:观测数据的类型--横截面数据
时间序列数据特征
不同时期同一个体特征(1个或多个变量)观测形成的数据集
时间是重要维度,观测值按时间的排序有意义。
时间的一个特征是数据频率:年、月、季、周、日、时
关键特征之一:经济数据的观测值与时间相关
时间序列数据建模不同于标准的计量经济建模
时序上的相依性
时序上的趋势性与季节性、持续性与动态性
数据结构
产出量 投资 消费水平 收入
1978
1979
1980
……..
时间序列数据
将横截面数据和时间序列数据混合后构成的数据集。
例如,每隔5年进行的家庭随机抽样调查—调查问题一致。
2000年获得500个样本
2005年获得400个样本
2010年获得450个样本
混合后的样本有1350个样本,都是随机样本,抽取的家庭一般不同,偶然相同。可以增大样本容量,可以对某一关键因素进行对比分析。
一般用于政策分析或评估。可在政策实施前后分别抽样获得这类数据。
混合横截面数据-pooled cross section
将不同个体在不同时间上的特点收集而成的数据集。
该数据集的主要特点
同一横截面的中每个个体都被跟踪了一段时间---不同于混合横截面数据
同一单位不同时期重复观测,数据采集难度较大。
这类数据使用的优越性
对同一单位进行重复观测,能控制单位本身具有但又不能观测的特征;
可对决策行为与结果滞后之间的关系进行因果推断
纵列数据或面板数据-panel data
列联表-----定性数据
基于相关的回归模型
路径分析
结构方程模型
早期统计学关于因果推断的理论和方法
定量数据:定距数据和定比率数
皮尔逊(K.Person, 1911)论述了因果与列联
(Contingency)的关系,并指出:两个事物之间根本的科学描述总能归结于一个列联表。
一旦认识了一个列联表的性质,他将掌握了原因与结果之间关联概念的本质,以及因果关系中这个本质的理想的极限性质。
列联表的重要
Pearl(2000)和Glymour(2001)在研究两个变量X和Y之间的因素关系时,比如吸烟X与是否患癌症Y,由X与Y的列联表仅能反映它们的关联性,而不能确定它们是否有因果关系。
不同观点
由两个以上的变量进行交叉分类的频数分布表
利用卡方检验两个变量是否相互关联,如果不相关则独立----被称为卡方的独立性检验。
零假设:两个变量之间没有关系。
列联表
介绍一下1957~1958年
您可能关注的文档
- [数学]2011届中考数学专题复习 第15讲 反比例函数课件.ppt
- [数学]2012一轮复习《高考调研》全套复习课件和练习10-4.ppt
- [数学]2012届新课标数学考点预测13:圆锥曲线与方程.doc
- [数学]2012期末复习:集合与函数二课时.ppt
- [数学]2012第九讲第三章整数的性质2.ppt
- [数学]2013人教版小学一年级数学下册《认识图形》.ppt
- [数学]23城市化.ppt
- [数学]4-1根轨迹法的基本概念.ppt
- [数学]6电偶测温.ppt
- [数学]7-弹性体振动01.ppt
- 小学科学:ESP8266智能插座电路原理与动手实践研究教学研究课题报告.docx
- 《金融开放浪潮下我国多层次监管体系构建与创新研究》教学研究课题报告.docx
- 区域教育质量监测中人工智能应用的数据质量分析与优化策略教学研究课题报告.docx
- 《金融科技监管中的数据治理与合规性要求》教学研究课题报告.docx
- 《3D打印技术在航空航天领域中的多材料制造与复合材料应用》教学研究课题报告.docx
- 《绿色金融发展中的政府职能与市场机制研究》教学研究课题报告.docx
- 《植物工厂多层立体栽培光环境调控技术对植物生长发育节律的调控机制探讨》教学研究课题报告.docx
- 销售团队年度业绩总结.docx
- 银行风险管理与金融危机防范.docx
- 银行网络攻击预警与快速响应机制.docx
文档评论(0)