大数据统计学基础.pdf

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据的统计学基础 第1课 DATAGURU专业数据分析社区 大数据的统计学基础 讲师黄志洪何翠仪 概率论与统计学  概率论是统计学的基础,统计学冲锋在应用第一线,概 率论提供武器  古典概率论  柯尔莫戈洛夫创建现代概率论  学会和运用概率,会使人变得更聪明,决策更准确 DATAGURU专业数据分析社区 大数据的统计学基础 讲师黄志洪何翠仪 参考书 DATAGURU专业数据分析社区 大数据的统计学基础 讲师黄志洪何翠仪 俄罗斯数学教材选译  /?key=%B6%ED%C2%DE%CB%B9%CA%FD%D1% A7%BD%CC%B2%C4%D1%A1%D2%EBact=click DATAGURU专业数据分析社区 大数据的统计学基础 讲师黄志洪何翠仪 统计学  统计学可以分为:描述统计学与推断统计学  描述统计学 :使用特定的数字或图表来体现数据的集中程度和离散程度。例:每次考 试算的平均分,最高分,各个分段的人数分布等,也是属于描述统计学的范围。  推断统计学 :根据样本数据推断总体数据特征。例:产品质量检查,一般采用抽检, 根据所抽样本的质量合格率作为总体的质量合格率的一个估计。  应用:统计学的应用十分广泛,可以说,只要有数据,就有统计学的用武之地。目前 比较热门的应用:经济学,医学,心理学等。 DATAGURU专业数据分析社区 大数据的统计学基础 讲师黄志洪何翠仪 集中趋势  例:对于1 2 3 4 5这组数据,你会使用哪个数字作为代表??——3  对于一组数据,如果只容许使用一个数字去代表这组数据,那么这个数字应该如何选 择??——选择数据的中心,即反映数据集中趋势的统计量  均值——算术平均数,描述平均水平  中位数——将数据按大小排列后位于正中间的数描述,描述中等水平  众数——数据中出现最多的数,描述一般水平 DATAGURU专业数据分析社区 大数据的统计学基础 讲师黄志洪何翠仪 均值 1 1  均值: = = ( + +⋯…+ ) =1 1 2  例:某次数学考试中,小组A与小组B的成员的成绩分别如下:  A :70,85,62,98,92 B :82,87,95,80,83  分别求出两组的平均分,并比较两组的成绩。  组A :(70+85+62+98+92 )/5=81.4  组B :(82+87+95+80+83 )/5=85.4  组B的平均分比组A的高,就是组B的总体成绩比组A高 DATAGURU专业数据分析社区 大数据的统计学基础 讲师黄志洪何翠仪 中位数  顾名思义,中位数就是将数据按大小顺序(从大到小或是从小到大都可以)排列后处 于中间位置的数。  例: 58,32,46,92,73,88,23  1. 先排序:23,32,46,58,73,88,92  2. 找出处于中间位置的数:23,32,46,58,73,88,92。三个数字比58小,三个数字比58 大  例:58,32,46,92,73,88,23,63——多加了一个数字,情况有何改变?  1. 先排序:23,32,46,58,63,73,88,92  2.找出处于中间位置

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档