第3节__数据的搜集.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
引子 12月21 日CSDN 部分用户信息遭到黑客泄露 12月22 日中国各大知名网站全面沦陷 12月23 日多玩、梦幻西游、人人网部分帐户密码通过木马泄露 12月24 日178、UUU9沦陷,事态蔓延,天涯全面沦陷,泄露多达900万帐户信息 网易土木在线也沦陷,数据量惊人 12月25 日百度疑因帐号开放平台泄露帐户信息 天涯疑泄露4000万用户资料 12月26 日Myspace用户数据泄露 塞班智能手机网校验准确率高达70% ,或塞班智能手机网沦陷 12月27 日网易土木论坛通过碰撞分析密码,用户资料全部属实!共计135文件,4.31G 178.com共计泄露超出1100万数据 凡客20万、当当10万 卓越20万用户资料验证泄露 12月28 日太平洋电脑泄露200万用户资料 工信部发布通告表示,强烈谴责窃取和泄露用户信息行为 12月29 日当当否认1200万用户信息泄露,称已向公安报案 传支付宝用户账号泄露达1500-2500万,官方称无资金安全威胁 微博传交通银行和民生银行用户资料外泄 12月30日工行、民生、交行等多家银行发布了官方声明,否认用户信息泄露 注:以上数据来自腾讯,内容仅供参考 引子 CSDN这次数据泄漏,同时也给了我们一些有趣的分析数据。我们可以轻松地统 计挨踢人士的邮箱使用情况,以及通常的密码长度等信息:大家通常最关心密码! 引子 大家最使用的密码长度不如所料,是8位左右 引子 最后一个有趣的数据是国内的邮箱使用情况 引子 统计了这次公布的6428632 个 CSDN 哪些密码出镜率较高? 统计结果显示有239 万人的密 码和别人存在重复,在所有 密码中,123456789 出镜率高 居榜首,有23 万5 千人使用它 作为密码。 引出问题 以上一系列网络信息泄露事 件 ,给各互联网公司安全带 来了巨大冲击 ,你能想到什 么? 第2章 数据来源与数据获取 2.1 数据与数据获取 2.2 抽样调查 2.3 调查设计 学习目标  1.了解数据的来源。  2. 了解普查、抽样调查的作用及特点。  3. 了解各种概率抽样与非概率抽样方法。  4. 了解抽样中的误差。  5.掌握数据的搜集方法。  6.学会设计调查方案和调查问卷。 北京建筑工程学院 Page 8 2.1 数据与数据获取 2.1.1 总体、个体、特征与数据 2.1.2 数据的类型 2.1.3 一手数据和二手数据 2.1.4 统计调查方式 北京建筑工程学院 Page 9 2.1.1 总体、个体、特征与数据 总体  所指研究对象的全体 ,称为总体 ( population or universe),又称为母体。 例如:  一年某专业的考生 (有限总体)  一条生产线上生产出来的某零件 (无限总 体,只要不停生产)  本省所有工人  本地区所有农民等。 北京建筑工程学院 Page 10 2.1.1 总体、个体、特征与数据 个体 (或成分)  组成总体的元素 (element ),称为个体 (Case or Individual )。 1 )个体数目有限的情况  在一个总体中 ,若

文档评论(0)

xiaofei2001129 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档