- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会学视角下的大数据方法论及其困境.pdf
48
201 6 3
新视野 · 数据与社会学所 无方 、
社会学视角下的大数据方法论 及其困境
文 /鲍 雨
摘要 :大数据不仅是一种庞大数据资料的称谓,也是一种获取和分析资料的方 法。在社会学研究领域,大数据的引入被认为是定量研完的范式下所做出的收集和 分析资料方法的创新。但是大数据在多大程度上反映人群的状况、能否解决被研究 者的主观性问题、如何洞悉变量间关系的真伪、如何解决数据缺失问题等方面,还 存在一定程度的方法论困境。这就要求研究者在使用大数据进行研究时,能够在研 完对象与问题的选择、变量的选取、数据的清理等一系列工作中更加谨慎,切勿犯 简化社会生活、盲目推广分析结果的错误。 关键词 :大数据 ;方法论 ;定量研究;方法论;困境 中图分类号 :C91-05文献标识码 :A文章编号:1 006—01 38(2O1 6)o3—0048—05
一 引 言
近年来,“大数据”(big data)作为一个热门话题在社会各领域被广泛 讨论。一般认为拥有“4V”的特征的数据集合是大数据:1)规模性(Volume), 数据的体积巨大 ;2)高速性 (Vetocity),数据产生、处理和分析的速度 快,数据具有实时性,且数据流量大。3)多样性 (Variety),大数据的类 型复杂,除传统的结构化数据之外,还包括大量非结构化数据。4)价值性 (Value),数据的整体价值及商业利润高,潜力巨大。?李天柱等在大数据 的 “4V”特征的基础上进一步指出 :“假设存在规模庞大、类型多样、动态 产生且价值巨大的 ‘特殊数据’集合,那么大数据可以定义为,在此 ‘特殊 数据’集合的基础上,借助计算科学及其它新兴技术来实现特定功能的整体 架构。” 大数据的魅力除了 “大”,更在于它将多学科、跨领域的数据结合 在一起,开辟了传统方法所不能实现的、更为创新的研究路径。 需要注意的是,大数据不仅是用于研究的经验材料,也是一种获取材料 的方式和运用材料的方法,具有独特的方法论逻辑。从已有的文献来看,大 部分是对大数据的赞扬之声,一些学者甚至断言大数据带来了社会科学范式 的革命,l3 超越了定量与定性研究的对立,【4 少数对大数据方法的质疑也仅 仅停留在数据获取的伦理问题上。 。然而,大数据作为一种收集和分析资料 的方法,能不能用于社会学研究之中,它在方法论上的基础是什么,其适用
作者简介 :鲍雨,江苏省社会科学院社会学所助理研究员,社会学博士,南京市
21 0005。
性和边界又在哪里,这些问题依然没有得到充 分探讨和回答。本文正是以此为起点,试图在 梳理社会科学领域大数据研究的基础之上,阐 述大数据在社会学研究中的方法论逻辑,并说 明大数据在应用过程中的方法论困境。
二 大数据的方法论逻辑
大数据是将社会生活数字化、数据化、变 量化,再通过测量这些变量,提取量化信息, 得到关于这个变量的描述以及多变量关系的分 析。大数据方法与定量研究范式有着共同的认 识论基础,但又有其特有的方法论特征。 (一)样本趋近总体 社会学定量研究为调查某一社会现象在总 体中的情况,在抽样框中随机抽取一定比例的 样本,通过描述和统计等一系列方法,得到样 本之中不同变量间的关系,并以此为依据推论 总体之中这些变量之间的状况。而以大数据为 经验材料的研究不涉及随机抽样的问题,而是 将全部总体纳入到分析的框架内,得出的变量 之间的关系也无需参数检验,而直接用于反映 总体趋势。例如,2015年 12月淘宝联合第一 财经商业数据中心推出的 淘宝大数据解读中 国消费趋势》的系列报告, 并不是将用户做 随机抽样形成样本,然后调查他们的性别、地 理位置、购物倾向等,而是直接将 3.86亿淘宝 用户这一总体作为分析的对象,描述总体的消 费状况并预测未来消费趋势。 (二)利用非传统方式获取数据
一 方面,大数据不同于传统问卷调查依靠 被研究者的主诉来获得资料,而是直接利用技 术手段对被研究者的行为进行检测。另一方面, 大数据的获取不依赖传统的社会统计部门。例 如,全国性人口普查是关于人口的最 “大”的 数据,理论上涵盖每一个个人的信息,体量巨 大,却不能被称为 “大数据”,因为人口普查数 据通过接触被调查者直接获取,并依赖传统的 社会统计部门逐级上报。大数据往往基于现代 科技手段,采取实时监控、测量、存储的方式 整合海量信息,例如交通流量监控、气象水文 监测数据、环境监测数据、商业物流的数据记 录,尤其是近年来基于互联网的浏览、搜索引擎、
犬数据与社会学所无方法 ·新视野
上传下载等行为的大数据,更是成为了大数据 的主流——甚至几乎成为了“大数据”的同义词。 (三)通过归纳建立模型 传统的定量研究先提出假设,并设计基于 假设的待检验模型,进而通过分析数据证明或 证伪假设
您可能关注的文档
- 生产力研究应得到历史学更多关注.pdf
- 生活政治视野中的山寨消费——山寨现象的社会学再解读.pdf
- 生计“脱嵌”生态——内蒙古科尔沁地区水资源问题的社会学考察.pdf
- 用社会学视角探析幼儿“插牌”选择区域活动的现象.pdf
- 用科学重建“社会”的权威——论涂尔干《社会学方法的准则》的主旨.pdf
- 略论地方本科院校历史学专业教学改革.pdf
- 略论师范院校历史学专业启发式教学与学生能力培养——以制度史课程为例的考察.pdf
- 知识人、国族想象与学科构建:以近代社会学和民族学为例.pdf
- 知识社会学关于思维方式的理论对价值观教育的启示.pdf
- 知识社会学的“视角”理论对高校社会主义核心价值观教育的启示.pdf
最近下载
- 脑血管疾病护理新进展题库答案-2025年华医网继续教育.docx VIP
- 装饰装修班组劳务分包合同范本.docx VIP
- 新概念英语第一册单词表打印版(最新整理) .pdf VIP
- (2025年)产前筛查与诊断试题附答案.docx VIP
- 人工智能生涯发展展示.pptx VIP
- 2025年河北省考《公安专业知识》真题与答案解析.docx VIP
- 肠道菌群检测.pptx VIP
- 体例格式6:工学一体化课程《windows服务器基础配置与局域网组建》任务7学习任务分析表.docx VIP
- 2025年公安基础知识真题及答案.docx VIP
- 2023年湖北十堰市张湾区城市社区党组织书记专项招聘事业编制人员笔试备考题库及答案解析.docx VIP
原创力文档


文档评论(0)