- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
规律与因果:大数据对社会科学研究冲击之反思——以社会学为例.pdf
社会科学 2016年第 9期 刘林平 蒋和超 李潇晓:规律与因果:大数据对社会科学研究冲击之反思
规律与因果:大数据对 社会科学研究冲击之反思
— — 以社会学为例
刘林平 蒋和超 李潇晓
摘 要:在社会科学中,大数据研究还刚刚起步,但也取得了一定成果。大数据为 社会学和社会科学重新发现社会历史发展规律提供 了可能性:它提供 了认知宏观社会、 检验社会现象的 “异质性假设”和 “结果稳定假设”的数据基础;它以实时记录的特 点较大程度上排除了获取数据时的人为干扰;它将抽样数据中被排斥的极端值重新纳入 统计分析。在因果关系上,大数据有助于从根本上克服由于抽样偏颇所引起的样本选择 性偏误;匹配数据可以克服或缓解变量遗漏问题;作为面板数据和分层数据,大数据对 确定因果效应、检验因果关系比抽样数据更为有利、稳健和可靠。大数据也许可以重构 社会学和社会科学的研究目标。 关键词:大数据;规律;因果关系;冲击;反思 中图分类号:C91-03 文献标识码:A 文章编号:0257-5833(2016)09-0067—14
作者简介:刘林平,南京大学社会学院教授、博士生导师;蒋和超,南京大学社会 学院博士研究生;李潇晓,南京大学社会学院博士研究生 (江苏 南京 210023)
一 、 大数据特征与社会学相关研究
“数据”是系统收集到的关于世界的信息要素①。 “大数据 (Big data或 Megadata),或称巨 量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达 到截取、管理、处理、并整理成为人类所能解读的形式的信息。”(2)由于互联网的普及和相关设备 的广泛使用,人类活动的痕迹几乎都可以转化为可以储存的数据,如日常起居、运动、购物、旅 行、休闲、人际交往、写作 (发表意见、评论和文章等)等等莫不如此。在社会和国家的层面, 经济、政治、军事、科学、教育、社会和文化活动,及人类对自然界的影响,都会留下可储存的 海量数据。这些数据可以用来分析人类活动的特点和规律。因而,大数据必然会对传统社会科学 的研究方式产生巨大冲击、挑战并提供新的机遇。本文从社会学和社会科学研究的基本目标人手 来进行反思。 大数据不同于传统数据之处在于:它不是通过抽样调查所获取的样本数据,而是人类活动的
收稿日期 :2016-05~4 ① [美]加里 ·金、罗伯特 ·基欧汉、悉尼 ·维巴:《社会科学中的研究设计》,陈硕译,格致出版社、上海人民出版社 2014年版。第21页。 ② https://zh。wikipedia.org/wik~大敷撩 ,2015—10-01。
67
社会科学 2016年第 9期 刘林平 蒋和超 李潇晓:规律与因果:大数据对社会科学研究冲击之反思
实时记录,并大都可以通过互联网存储、获取、交换和分析。大数据是 “由科学仪器、传感设 备、互联网交易、电子邮件、音视频软件、网络点击流等多种数据源生成的大规模 、多元化、复 杂、长期的分布式数据集”①。大数据有多方面的来源,一般而言可以分作五类:企业公司数据, 指来自公司企业的销售、交易等数据,比如阿里巴巴的销售数据、证券公司的交易数据等;网络 数据,主要是指来自互联网、社交媒介的数据,比如 Facebook、Twiter、新浪微博等;期刊图书 数据库,是指取自某一个具体的数据库的数据,比如 CNKI期刊数据库、Web of Science、Google 图书等;政府数据,是指源 自政府的总体数据,比如人口普查数据、全国用水用电数据等;其 他,是指除上述四类数据之外的其他数据,但不包含抽样调查数据。有关大数据的基本特征,我 们可以在与传统数据的比较中进行描述和分析。 1.样本与总体 和以往抽样调查获得的数据不同,大数据不是抽样数据而是一个总体数据。但是,这个总体 是一定范围里的总体,而不是绝对总体。比如,人们通过京东商城购物,所有的购物过程都可以 转化为数据,所得到的总体就是在京东商城发生购物行为的总体。这个总体不是所有网上购物者 的总体,更不是包括线下购物者的全部购物者的总体。不过,有一些数据的总体,就是一个完整 的总体。比如,美国国防气象卫星计划 (Defense Meteorological Satelite Program)的夜间灯光图 像数据,就是每天对地球进行扫描的数据,其平均灯光强度可以作为代表区域社会经济发展的指 标,现有研究表明这一指标与 GDP的相关度非常高②。这个数据的总体,就是整个地球。因而, 我们不能笼统地说总体,而要具体看该数据所代表的总体是什么样的总体。这样所得结论的界限 就比较明确。 作为总体的大数据,在统计上至少有两个意义:其一,它可以给抽样数据提供参照,纠正其 偏差。抽样调查采用抽样数据推断总体,实际上,很大程度上对总体
您可能关注的文档
- 艺术家的微观社会学还是扩展的天才观念?——评阿尔帕斯《伦勃朗的企业——工作室与艺术市场》.pdf
- 节日的功能及其社会学隐喻.pdf
- 花架婚姻与同妻之痛——浅析社会学视角下当代中国同妻的困境.pdf
- 英译本《红高粱家族》在美国赢得读者青睐的原因探究——布迪厄社会学视角.pdf
- 荀子“以礼导欲”思想的社会学意义.pdf
- 葛浩文英译《红高粱》生产过程社会学分析.pdf
- 蒙古族传统体育民间传承的社会学研究.pdf
- 薄弱高中历史学考复习方略刍议.pdf
- 虐待老人问题的社会根源研究——基于“个体化”理论的社会学想象.pdf
- 蜀道文化线路的历史学认知.pdf
- 实景三维全民城管解决方案白皮书.doc
- 2023年曲靖市选调公务员笔试真题汇编含答案解析(夺冠).docx
- 2023年曲靖市遴选公务员考试真题汇编附答案解析(夺冠).docx
- 2023年曲靖市选调公务员考试真题汇编附答案解析.docx
- 2023年曲靖市选调公务员考试真题汇编附答案解析(夺冠).docx
- 2023年曲靖市税务系统遴选考试真题汇编及答案解析(夺冠).docx
- 2023年朔州市直属机关遴选公务员考试真题汇编含答案解析(夺冠).docx
- 2023年曲靖市税务系统遴选考试真题汇编含答案解析(夺冠).docx
- 2023年曲靖市税务系统遴选考试真题汇编及答案解析(夺冠).docx
- 2025年宠物殡葬服务门店运营与消费偏好研究.docx
最近下载
- FASB与IASB联合趋同.pdf VIP
- 2025电动自行车停放充电场所消防安全规范.docx VIP
- ChangKJ_Numericalanalysisoflandslide-triggering.doc VIP
- DGJ08-2068-2012 公共建筑用能监测系统工程技术规范.pdf VIP
- DGJ08-105-2003 控制性详细规划编制成果规范.docx VIP
- DGJ08-89-2000 网架与网架工程质量检验及评定标准.docx VIP
- DGJ08-81-2015 现有建筑抗震鉴定与加固规程.docx VIP
- DGJ08-80-1999 聚乙烯埋地燃气管道工程技术规程.docx VIP
- DGJ08-90-2000 水利工程施工质量检验评定标准(试行).docx VIP
- DGJ08-81-2021 现有建筑抗震鉴定与加固标准.docx VIP
原创力文档


文档评论(0)