大学课程《机器学习与经济学实证应用》PPT课件:第9讲_机器学习与因果识别.pptxVIP

大学课程《机器学习与经济学实证应用》PPT课件:第9讲_机器学习与因果识别.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1第9讲机器学习与因果识别

主要内容2机器学习的原理与应用回顾机器学习与因果识别机器学习与异质性因果大数据时代因果识别的挑战结论与展望

主要内容3机器学习的原理与应用回顾机器学习与因果识别机器学习与异质性因果大数据时代因果识别的挑战结论与展望

机器学习的原理与应用回顾4机器学习关注点主要在于预测计量经济学重点:参数估计、因果推断相对于计量经济学,机器学习不仅仅是使用了不同的方法(很多方法其实是重叠的),更重要的是关注点不同。譬如,传统社会科学实证更关心无偏性。为了实现无偏估计,不知道也无法获得数据的真实分布,最好的策略是建立一个非常复杂的模型,以尽可能实现一致估计。但这种情形下,模型通常会“过度拟合”样本数据,从而导致在样本以外的数据无效(YarkoniandWestfall,2017)。相对于计量经济学,机器学习更加关注模型的预测能力:结论是否可以外推(范化,generalize)

机器学习的原理与应用回顾5在监督学习中,我们的目的是在训练数据中构建模型,然后能够对没见过的新数据做出准确预测。如果一个模型能够对没见过的数据做出准确预测,我们就说它能够从训练集范化(generalize)到测试集。过拟合(over-fitting):机器学习算法在训练样本中表现得过于优越,导致在测试数据集中表现不佳。欠拟合(under-fitting):如果模型过于简单,无法捕抓数据的全部内容以及数据的变化,在训练集就表现很差,更别提测试数据。过拟合与欠拟合

机器学习的原理与应用回顾6正则化?Lasso回归:岭回归:

机器学习的原理与应用回顾7机器学习主流算法经典回归算法:OLS回归、logit回归、岭回归、Lasso回归经典分类算法:K近邻、朴素贝叶斯算法、决策树算法、支持向量机算法集成算法:随机森林、梯度下降树、xgboost深度学习算法:BP神经网络、卷积神经网络、递归神经网络无监督学习算法:聚类算法、主成分分析算法、LDA主题算法自然语言处理:TFIDF、Word2vec词嵌入、Bert预处理模型

机器学习的原理与应用回顾8我们能用机器学习做什么?预测(公司破产概率、经济是否衰退)数据生成(文本中的情绪、从姓名推测性别)因果识别(构造反事实结果、异质性检验)

主要内容9机器学习的原理与应用回顾机器学习与因果识别机器学习与异质性因果大数据时代因果识别的挑战结论与展望

机器学习与因果识别10因果识别是社会科学研究重中之重在经济学、社会学和政治学等各类社会科学研究中,特别是最近二十年的社会科学研究中,识别因果关系(CausalRelationship)已经成为重中之重(Athey,2017;ImbensandWooldridge,2009;AtheyandImbens,2017;AbadieandCattaneo,2018)。

机器学习与因果识别11机器学习方法和因果识别存在一定隔阂机器学习方法的主要优势就在于对包括非结构化数据在内的大数据进行降维、分类和预测等(Ghoddusietal.,2019)。机器学习方法和因果识别存在隔阂:预测中,仅仅需要知道变量之间存在相关关系(Kleinbergetal.,2015),因此很多机器学习算法也就忽略了变量间的因果关系,而只关心结果变量和特征变量之间是否存在相关关系。不过,机器学习方法与因果关系识别之间并不全然是冲突的,凭借其在处理高维数据、非线性关系等上的优势,以及在进行变量预测等方面所取得的成功,机器学习方法对因果关系识别也有非常重要的价值。

机器学习与因果识别12机器学习与因果识别代表性文献机器学习代表性综述:Varian(2014)、Grimmer(2015)、MullainathanandSpiess(2017)、Athey(2018)、AtheyandImbens(2019)、Ghoddusietal.(2019)、Stormetal.(2019)、黄乃静和于明哲(2018)、王芳等(2020)。机器学习代表性教科书:Hastieetal.(2017)、Jamesetal.(2013)、Burkov(2019)面向机器学习研究者,介绍因果关系文献不少,例如:Sch?lkopf(2019)、KreifandDiazOrdaz(2019)、Guoetal.(2020)、Varian(2016)。但面向熟悉因果识别,但不熟悉机器学习的社会科学工作者介绍机器学习及其在因果识别中的意义的文献不多。我们进行了这个尝试,撰写了这篇综述文章。

机器学习与因果识别13机器学习在因果识别中的价值更好地识别和控制混淆因素帮助更好地构建对照组更好地识别异质性因果效应以及检验因果关系的外部有效性

机器学习与因果识别14更好地控制混淆因素机器学习助力更好地

您可能关注的文档

文档评论(0)

专业写作专家 + 关注
实名认证
服务提供商

人力资源管理师持证人

专注于企业方案、制度、报告、总结、规划编制,PPT制作等

领域认证该用户于2023年09月21日上传了人力资源管理师

1亿VIP精品文档

相关文档