- 2
- 0
- 约1.38万字
- 约 12页
- 2019-05-05 发布于天津
- 举报
⼤兴区2017年“⼀模”⾼三语⽂试卷
⼀、本⼤题共7⼩题,共25分。阅读下⾯材料,完成1-7题。
材料⼀
百度曾经发布了⼀个统计结果,叫《中国⼗⼤“吃货”省市排⾏榜》。榜单上的⼀些内容⾮常有趣,像北京
⽹友最经常问的问题是“某某的⽪能不能吃” ;内蒙古⽹友最关⼼“蘑菇能吃吗” ,宁夏⽹友最关⼼的竟然是“螃蟹
能吃吗” 。这个榜单的数据是怎么来的呢?百度没做民意调查和饮⾷习惯的研究,⽽是从“百度知道”的7700万条
和吃有关的问题⾥“挖掘”出来的。
这件事就反映了⼤数据的 甲 。因为“百度知道”的数据维度很多,不光涉及⾷物的做法、吃法、成分、
价格,还能收集⼀些隐含信息。⽐如提问者或回答者的个⼈信息,⽤的是⼿机还是电脑,⽤什么浏览器。这样,
百度就可以得到不同年龄、性别和⽂化背景的⼈的饮⾷习惯。如果再结合每个⼈使⽤的⼿机或电脑的品牌和型
号,分析他们的收⼊,百度甚⾄能分析出不同收⼊阶层的⼈的饮⾷习惯。也就是说,这些隐形维度对于饮⾷习
惯虽然没有直接影响,但是如果把原来看上去没关系的维度联系起来,经过挖掘、加⼯和整理,就能得出有意
义的统计规律。
接下来我们看看⼤数据的时效性。它帮助我们做到了很多过
原创力文档

文档评论(0)