- 1、本文档共242页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据时代的社会研究
计算社会学
目录
第1章简介1.1一处墨迹
1.2欢迎来到数字时代
1.3研究设计
1.4本书的主题1.5本书梗概
第2章观察行为
2.1简介2.2大数据
2.3大数据的10个共同特征2.4研究策略
2.5结论
第3章提问
3.1简介
3.2提问与观察
3.3调查误差总框架3.4向谁提问
3.5提问的新方法
3.6与大数据资源相结合的调查3.7结论
第4章开展实验
4.1简介
4.2什么是实验
4.3实验的两个维度:实验室-实地以及模拟-数字
4.4超越简单实验
4.5使实验成为现实4.6建议
4.7结论
第5章进行大规模协作
5.1简介
5.2人本计算5.3公开征集
5.4分布式数据采集
5.5设计你自己的大规模协作项目5.6结论
第6章道德伦理
6.1简介
6.2三个事例
6.3数字时代的不同6.4四项原则
6.5两种道德框架
6.6困难面
6.7实用技巧6.8结论
历史附录
第7章未来7.1展望
7.2未来主题7.3回到开始
第1章简介
1.1一处墨迹
2009年夏天,手机铃声响遍了整个卢旺达。除了来自家人、朋友和商业伙伴的数百万个电话之外,大约有1000名卢旺达人还接到了由乔舒亚·布卢门斯托克(JoshuaBlumenstock)及其同事打来的电话。研究人员从卢旺达最大手机供应商的数据库中随机抽样进行调查,以完成对财富与贫困的研究,这个数据库中有150万名客户。布卢门斯托克和他的同事会询问这些被随机选中的人是否愿意参与调查,然后向其解释这项研究的性质,接下来便会询问一系列有关他们的人口学特征、社会特征和经济特征方面的问题。
到目前为止,我所描述的一切都让这项研究听起来像是一项传统的社会科学调查。但接下来我要描述的就不再传统了,至少目前来说是这样的。除了调查而来的数据外,布卢门斯托克和同事还拥有这150万人的完整通话记录。他们将这两部分数据结合起来,利用调查数据训练了一个机器学习模型,使模型能根据一个人的通话记录预测其财富状况。接着,他们利用这个模型评估数据库中150万名客户的财富状况,还利用通话记录中包含的地理信息判断这150万名客户的居住位置。最后他们将所有这些信息——估算的财富状况以及居住位置,综合到一起,绘制出高分辨率的卢旺达财富地理分布图。尤其是,他们能够估算出卢旺达2148个街区(该国的最小行政单位)中每一个街区的财富状况。
要证实这些估算是不可能的,因为从来没有人估算过卢旺达中如此小的地理区域的财富状况。但在布卢门斯托克和同事把这些估算值汇总为分别反映卢旺达30个地区财富状况的数值后,
他们发现,这些数值与通过人口统计和健康调查(DemographicandHealthSurvey)得到的数据非常接近,而人口统计和健康调查被认为是发展中国家调查的黄金标准。虽然这两种方法在此案例中产生了类似的结果,但布卢门斯托克和同事的方法要比传统的人口统计和健康调查的方法快了差不多10倍,成本为后者的1/50左右。这些明显更快、更节省成本的预测为研究人员、政府和公司创造了新的可能性(Blumenstock,Cadamuro,andOn2015)。
这项研究有点像一个罗夏墨迹测验(注):人们看到的事物取决于他们的背景。许多社会科学家从中看到了一个新的测量工具,这个工具可以检验经济发展理论。许多数据科学家从中看到了一个很酷的、新的机器学习问题。许多商界人士看到了一个可以让他们从已经搜集到的大数据中获利的好方法。许多隐私权倡导者从中看到了一个可怕的警示:我们也许生活在一个大规模监控的时代。最后,许多政策制定者从中看到了新技术能够帮助我们创造一个更好的世界。其实,这项研究与这些都相关,而且正是因为它融合了这么多特征,所以我把它看作了解社会研究之未来的一扇窗。
1.罗夏墨迹测验是一种著名的人格测验,它会向被试呈现由墨迹偶然形成的图案,让被试观看并说出由此联想到的事,研究人员由此对反应符号进行分析,从而判断被试的人格特征。——编者注
1.2欢迎来到数字时代
数字时代无处不在,它在不断发展,并且改变着研究的可能性。
这本书的核心前提是数字时代能为社会研究创造新的机会。研究人员现在能以不久前还几乎不可能的方式观察行为、提出问题、开展实验以及彼此协作。但新的风险也随之而来:研究人员现在能以过去绝不可能的方式去伤害人们。这些机会和风险源于从模拟时代到数字时代的转变。这种转变并不是像开灯那样瞬间就发生了,事实上,这种转变目前还尚未彻底完成。但目前为止发生的事情,已经足以让我们相信有大事正在发生了。
注意到这种转变的一个方法是观察发现你们日常生活中的变化。生活中,许多曾经是模拟的东西现
文档评论(0)