规律与因果大数据对社会科学研究冲击之反思——以社会学为例.pdfVIP

规律与因果大数据对社会科学研究冲击之反思——以社会学为例.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
规律与因果大数据对社会科学研究冲击之反思——以社会学为例.pdf

社会科学 2016 年第9 期 刘林平蒋和超李潇晓:规律与因果:大数据对社会科学研究冲击之反思 规律与因果:大数据对 社会科学研究冲击之反思 一一以社会学为例 刘林平蒋和超李潇晓 摘 要:在社会科学中,大数据研究还刚刚起步,但也取得了一定成果。大数据为 社会学和社会科学重新发现社会历史发展规律提供了可能性:它提供了认知宏观社会、 检验社会现象的异质性假设和结果稳定假设的数据基础;它以实时记录的特 点较大程度上排除了获取数据时的人为千扰;它将抽样数据中被排斥的极端值重新纳入 统计分析。在因果关系上,大数据有助于从根本上克服由于抽样偏颇所引起的样本选择 性偏误;匹配数据可以克服或缓解变量遗漏问题;作为面板数据和分层数据,大数据对 确定因果效应、检验因果关系比抽样数据更为有利、稳健和可靠。大数据也许可以重构 社会学和社会科学的研究目标。 关键词:大数据;规律;因果关系;冲击;反思 中固分类号: C91 -03 文献标识码:A 文章编号: 0257-5833 (2016) 09拍67-14 作者简介:刘林平,南京大学社会学院教授、博士生导师;蒋和超,南京大学社会 学院博士研究生;李潇晓,南京大学社会学院博士研究生 (江苏 南京 21∞23) 一、大数据特征与社会学相关研究 数据是系统收集到的关于世界的信息要素①。大数据 (Big data 或 Megadata) ,或称巨 量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达 到截取、管理、处理、并整理成为人类所能解读的形式的信息。②由于互联网的普及和相关设备 的广泛使用,人类活动的痕迹几乎都可以转化为可以储存的数据,如日常起居、运动、购物、旅 行、体闲、人际交往、写作(发表意见、评论和文章等)等等莫不如此。在社会和国家的层面, 经济、政治、军事、科学、教育、社会和文化活动,及人类对自然界的影响,都会留下可储存的 海量数据。这些数据可以用来分析人类活动的特点和规律。因而,大数据必然会对传统社会科学 的研究方式产生巨大冲击、挑战并提供新的机遇。本文从社会学和社会科学研究的基本目标人手 来进行反思。 大数据不同于传统数据之处在于:它不是通过抽样调查所获取的样本数据,而是人类活动的 收稿日期: 2016~5-24 ① [美]加里·金、罗伯特·基欧汉、悉尼·维巴: (社会科学中的研究设计).陈硕译,格致出版社、上海人民出版社 2014 年版,第21 页。 ② https:llzh. wikipedia. 0咆lwikν大数拢. 2015-1O~1 0 67 刘林平蒋和超李满晓:规律与因果:大数据对社会科学研究冲击之反思 社会科学 2016 年第9 期 实时记录,并大都可以通过互联网存储、获取、交换和分析。大数据是由科学仪器、传感设 备、互联网交易、电子邮件、音视频软件、网络点击流等多种数据源生成的大规模、多元化、复 杂、长期的分布式数据集①。大数据有多方面的来源,一般而言可以分作五类:企业公司数据, 指来自公司企业的销售、交易等数据,比如阿里巴巴的销售数据、证券公司的交易数据等;网络 数据,主要是指来自互联网、社交媒介的数据,比如 Facebook 、 Twitter 、新浪微博等;期刊图书 数据库,是指取自某一个具体的数据库的数据,比如 CNKI 期刊数据库、 Web of Science 、Google 图书等;政府数据,是指源自政府的总体数据,比如人口普查数据、全国用水用电数据等;其 他,是指除上述四类数据之外的其他数据,但不包含抽样调查数据。有关大数据的基本特征,我 们可以在与传统数据的比较中进行描述和分析。 1. 样本与总体 和以往抽样调查获得的数据不同,大数据不是抽样数据而是一个总体数据。但是,这个总体 是一定范围里的总体,而不是绝对总体。比如,人们通

您可能关注的文档

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档