7.1.1 大数据时代来临 数据收集及抽样.docxVIP

7.1.1 大数据时代来临 数据收集及抽样.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
7.1.1. 数据收集与抽样 ○.大数据时代来临一.数据的收集1.数据的来源:直接来源—调查;间接来源—媒体.2. 收集数据的意义:有助于我们发现事物的统计规律,作出科学决策.3. 收集过程:4. 数据的质量:真实性、准确性、一致性、及时性.例 假若你想知道自己的步长,那么你在通过调查收集数据的过程中, (1) 调查问题是 跨一步的平均长度是多少 . 调查对象是 自己 . (2) 你要记录的数据是 调查对象的步长 . (3) 你将如何开展调查并得出结论? 尽量保持每步所跨的距离相等,然后量出所走的距离,除以步数,得到平均步长 . 1.为了了解同学的生日,班长对全班同学作了一次调查,结果没有同月同日生的同学.下列结论不正确的是( ). A. 调查对象是全班每位同学 B. 调查问题是有没有同月同日生的同学 C. 调查方法是同学自报出生年月日 D. 调查结论是每班没有同月同日生的同学 2. 某家庭准备购买一辆小轿车,不知道什么品牌的好,于是决定作一番调查,以取得有关数据,有哪些方法? 3.在一次通俗歌曲大奖赛上, 评委组的15个评委对一位歌手的评分分别为9.4, 9.3, 9.2, 9.2, 9.1, 9.1, 9.0, 9.0, 9.0, 8.9, 8.9, 8.0, 8.0, 7.8, 7.8. 大奖赛主持人要求去掉一个最高分和一个最低分,再计算这位歌手的平均分.为什么?二. 调查与统计基本概念 1. 普查与抽样调查 人口普查,统计报表等必须普查.尝苹果好坏、检查烟花爆竹质量、测定灯泡寿命等只能抽样调查.3.统计的基本概念:总体、个体与样本样本中数据的个数称为样本容量.例 某校为了了解学生身体素质, 从全体学生中抽查了50个学生的体重. 则下列说法是否正确?如不正确,请改正. A. 总体是全体学生 B. 个体是50个学生中的每一个C. 样本是50个学生的体重 D. 样本容量是50人 解: 考察的对象是全体学生的体重,是抽象的数据,而不是活生生的50名学生;这是决定什么是总体、个体与样本的关键. A. 应改为:总体是全体学生的体重; B. 应改为:个体是每个学生的体重,而且个体不仅是样本中的每一个,是指总体中的每一个; C. 是正确的; D. 样本容量是不带单位的,即样本容量是一个数,应改为:样本容量是50. 3.用样本估计总体,对样本的要求 (1) 随机性:抽样调查要求总体中每一个个体都有被选到样本的同等机会,并且其中一个的选取并不影响另一个的选取,即随机抽样. (2) 代表性: 用样本估计总体要求样本具有代表性,样本容量越大,越具有代表性. 1. 下列调查适宜采用普查的是( ) . A.了解中学生记住父母生日的人数 B.了解参加运动会的全体运动员的身高C.检查我国热水器的质量情况 D.为了报考大学,检查学生的身体情况 2. 要了解某产品的质量,从中抽取了10件产品进行统计,以下说法正确的是( ).A. 所有产品的质量是总体 B. 这10件产品是一个样本 C. 每件产品都是个体 D. 样本容量是10件 3. 某省有7万名学生参加初中毕业会考,要想了解这7万名学生的数学成绩,从中抽取了1000名考生的数学成绩进行统计分析,以下说法正确的是(). A. 7万名考生是总体 B. 这1000名考生是总体的一个样本 C. 每位考生的数学成绩是个体 D. 1000名考生是样本的容量4. 实验中学初一年级进行了一次数学测验,参考人数共540人.为了了解这次数学测验成绩,下列所抽取的样本中较为合理的是(). A. 抽取前100名同学的数学成绩 B.抽取后100名同学的数学成绩 C.抽取某两班同学的数学成绩 D.抽取各班学号为3的倍数的同学的数学成绩5. 下列抽查具有代表性的是(). A. 为掌握作业量,在某年级学生中抽取学号末位数为6的学生进行调查; B. 为了解学生对伙食的意见,上学期间,在校门口每隔2分钟调查一个学生; C. 为检查食品卫生,在几家超市用随机抽样的方法检查了某些食品; D. 为调查市民对某电视的收视率,记者在马路上随机调查了5位青年.6. 为了测量调查对象每分钟的心跳情况,甲同学建议测量2分钟的心跳次数再除以2,乙同学建议测量5秒种的心跳数再乘以12,丙同学建议就测量1分钟的心跳次数.你认为建议较好的是.7.请指出下列哪些调查不适合作普查而适合作抽样调查:. A. 了解班级中有多少同学喜欢数学; B. 了解全体学生体育锻炼的时间 C. 了解市民最喜欢

文档评论(0)

0520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档