- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 专题三 话题五
话题五 大数据一、阅读下面的文字,完成文后题目。材料一:2017年3月,由中南民族大学教授王兆鹏与搜韵网站共同打造的《唐宋文学编年系地信息平台》正式上线,仅两天,网络点击量就达220万次。登陆平台,点击诗人名字,即可看见他一生行迹的文字版和路线图,点击路线图中的任一个地点,能看到他在这里的生活轨迹,留下的作品,该平台利用大数据打造了一张“文化版”中国地图。这之前,文学研究几乎没有利用过大数据,该地图第一次打通了历史的时空隔阂,将唐宋诗人请出了“格子间”。这并非王兆鹏第一次将大数据和文学连接在一起。上世纪90年代,他就利用大数据给唐诗宋词排名次,结果遭到一片骂声,但王兆鹏却还是选择相信数据,他觉得在将来的文史研究中,作品的好坏评价“必须要有数据作支撑”。该地图还引起了海外研究者的关注,哈佛大学相关项目组也发来邮件,希望合作共享数据。(摘编自翁佳妍《用一张地图,将唐宋诗人请出“格子间”》)材料二:我们生活在一个任何人都无法摆脱数据的大数据时代。数据越多,人们做出的分析就越多;人们分析得越多,制造的烟幕弹也就越多。因此不能单看数据的表象,要保持清醒的头脑。以美国交通部关于对阿拉斯加航空公司和美国西部航空公司的飞机晚点率统计分析为例:自1987年起,美国交通部就要求航空公司上报每个月的晚点记录。在最近的报告中,美国西部航空公司是表现最好的一家,晚点率最低。在竞争对手纷纷倒闭的情况下,形势一片大好。但1991年的夏天,美国西部航空公司却宣布破产,这与分析人员统计分析有关。分析人员统计分析时只关注四个对象:客机、到达机场、客机数量和晚点频率,而忽视了天气条件、载客率等,又加之在统计平均数时,对某些指标进行过度加权后,两个公司的平均晚点率就完全走向了反面。(摘编自美国冯启思《对“伪大数据”说不:走出大数据分析与解读的误区》)注 统计学认为,在统计中计算平均数等指标时,为了考虑到每个数量在总量中所具有的重要性不同可以给予不同的权数,这样的做法就叫加权,即对各评价因子在总体评价中的作用进行区别对待,事实上,没有重点的评价就不算是客观的评价。材料三:近日,《农业农村大数据试点方案》(以下简称《方案》)正式印发。据介绍,《方案》旨在运用大数据概念和技术创新农业监测统计工作的思路和办法,推动大数据在农业生产、经营、服务等环节的应用,形成一批可复制、可推广的成果。试点省份包括:天津、上海、江苏、安徽、江西、山东、湖南、广东、广西、重庆、四川、贵州、云南、青海、新疆,当前由于农业数据的共享开放不足,导致信息孤岛、数据壁垒、数据碎片化和信息不对称等问题大量存在。农业部市场与经济信息司副司长王小兵认为,充分利用大数据对农业生产要素实行数字化设计、智能化控制、精准化运行、科学化管理,是推进农业现代化的必然选择。(摘编自《〈农业农村大数据试点方案〉公布:打破信息孤岛共享涉农数据》)1.下列对材料二相关内容的理解,不正确的一项是( )A.图1数据支持以下结论:整体上,美国西部航空公司正点到达的表现要胜过阿拉斯加航空公司。B.图2数据支持以下结论:美国西部航空公司在每个机场的正点到达率均低于阿拉斯加航空公司。C.美国西部航空公司最终走向了破产,这与分析人员所关注的评价对象不够全面有着一定的关系。D.为了统计的科学性和准确性,我们不能够在加权后进行平均数的统计,否则统计结果会有偏差。2.下列对材料相关内容的概括和分析,正确的两项是( )A.《唐宋文学编年系地信息平台》利用大数据打造了一张“文化版”中国地图,这是国内文学研究领域首次利用大数据的个案。B.王兆鹏的研究引起了哈佛大学相关项目组的关注,这说明海内外的文学研究者对于大数据的利用还是有一些共识和期待的。C.冯启思认为数据越多,人们的分析就越多,烟幕弹也就会更多,所以不能只关注数据的表象,要敢于对“伪大数据”说不。D.从《农业农村大数据试点方案》的试点省份分布来看,说明我国当下利用大数据推进农业发展的侧重点应该放在西部地区。E.大数据的使用为社会发展提供了数据支持,使得一些领域出现了前所未有的良好局面,因此利用大数据是行业发展的前提。3.根据上述材料,概括说明在信息化的当下我们该怎么对待大数据研究。答: 二、阅读下面的文字,完成文后题目。材料一:采用所有数据而不是样本数据,增加了我们解决问题的方法和能力,甚至挽救或者延长了人的生命,这就是大数据的魅力所在。任何事物都有两面性,大数据的最大弊端就是隐私。Google、Yahoo!、微软搜索以及其他许多搜索引擎,使得所有人仅在搜索框中输入一两个关键字就能访问这些网页。然而在不经意间,搜索引擎记住了许多,比网上发布的信息多得多。Google能识别出我们每个人在什么时候搜索了什么,以及我们可能觉得足够准确并点击进去的搜索结果是什么。毫不夸张地说,Google对我们的了解
文档评论(0)