数据分析基础课程 第一章 数据分析概述.pptxVIP

数据分析基础课程 第一章 数据分析概述.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据分析基础以分析大数据时代对大学生就业能力基本要求出发,以数据的处理与数据的分析为重点,采用案例教学模式组织内容,将理论融入案例。目录/Contents第一章 数据分析概述1.1 什么是数据分析1.2 统计学的几个基本概念1.3 统计指标的分类1.1 什么是数据分析数据分析是指对大量数据进行整理后,利用适当的统计分析方法,把隐藏在数据背后的信息提炼出来,并加以概括总结的过程。数据分析包括如下几个主要内容。? 现状分析:分析已经发生了什么。? 原因分析:分析为什么发生某一现状。? 预测分析:分析将来可能发生什么。?1.1.1 数据分析的过程数据分析的过程主要包括6个既相对独立又相互联系的阶段,下面分别进行介绍。1.确定分析目的2.收集数据3.数据处理4.数据分析5.数据展现6.撰写报告1.1 数字通信系统的基本概念41.1.2 数据分析的工具数据分析的相关工具可以分成以下3种。(1)存放数据的工具。(2)分析数据的工具。(3)做分析报告的工具。1.2 统计学的几个基本概念1.2.1 现象总体和现象个体现象总体(以下简称总体)是由客观存在的、具有某种共同性质又有差别的许多个别单位所构成的整体。构成总体的每一个事物或基本单位,叫现象个体(以下简称个体)。原始资料最初就是从每个个体中取得的,所以个体是各项统计数字最原始的承担者。表1-1 某学校全体学生资料一览表姓名性别身高(cm)体重(kg)爱好张三男17568篮球李四男17270唱歌王二女16350舞蹈………………………… 根据表1-1的数据,进一步理解什么是总体,什么是个体。总体必须具备3个特性:大量性、同质性和变异性。(1)大量性:是总体的量的规定性,即指总体的形成要有一个相对规模的量,仅仅由个别单位或极少量的单位不足以构成总体。(2)同质性:是指构成总体的各个单位至少有一种性质是共同的,同质性是将总体各单位结合起来构成总体的基础,也是总体的质的规定性。(3)变异性:是指总体各个单位除了具有某种或某些共同性质以外,在其他方面则各不相同,具有质的差异和量的差别,这种差别叫变异。表1-2 江西省工业企业总产值一览表企业名称工业总产值(万元)企业14000企业26000企业39000…………例如:在研究江西省所有工业企业的工业总产值时(见表1-2),每个企业的工业总产值都是个体,但在研究其中某一个企业的工业总产值时,则该企业又成了总体。1.2.2 标志和标志表现通常,每个个体具有许多属性和特征。这些属性或特征叫标志。标志的属性或数量在每个个体的具体表现,叫标志表现。标志按其性质可以分为数量标志和品质标志。? 数量标志:以数量的多少来表示的标志,表示事物量的特性。? 品质标志:不能用数量而只能以性质属性上的差别即文字来表示的标志,表示事物质的特征。1.2.3 统计指标假如通过对表1-1的统计计算,可能得出以下统计结果:? 学校总人数5000人? 男生人数2600人? 女生人数2400人? 男女性别比1.08:1? 平均身高172cm? 平均体重62kg这些数据在统计学上都称为统计指标。统计指标就是反映总体的数量特征的概念和具体数值。通常,一个完整的统计指标包含指标名称和指标数值两部分。1.3 统计指标的分类1.按反映的内容或数值表现形式划分按照其反映的内容或其数值表现形式,可划分为总量指标、相对指标和平均指标。(1)总量指标:反映总体规模的统计指标,通常以绝对数的形式来表现,因此又称为绝对数。总量指标是人们认识总体的起点,是计算其他统计指标的基础。(2)相对指标:是两个总量指标之比,因此又称相对数。(3)平均指标:平均指标又称平均数,是总体在某一空间或时间上的平均数量状况。2.按所反映的数量特点与内容划分按照其所反映的数量特点和内容,可划分为数量指标和质量指标。(1)数量指标:反映总体的范围广度、规模大小和数量多少的指标。它表示事物外延量的大小,通常有计量单位,用绝对数表示。其指标数值大小随总体范围的大小而增减变动。(2)质量指标:反映总体的质量、强度、经济效果等的统计指标。它表示事物内涵量的状况,通常用相对数或平均数表示。其指标的数值大小与总体范围大小没有直接的关系。1.3.1 总量指标总量指标是指统计汇总后得到的具有计量单位的统计指标,反映研究总体在一定时期或时点的总规模、总水平或性质相同的总体规模的数量差异。按总量指标所反映的时间状况来划分,总量指标可以分为时期指标和时点指标。(1)时期指标:是反映总体在一段时间内的累计总和。(2)时点指标:是反映总体在某一时点上的状态总数。1.时期指标与时点指标的区别(1)性质相同的时期指标的数值可以相加,而时点指标相加则无意义。(2)同类时期指标数值的大小与时期长短有直接关系,而时点指标则没有这种关系。(3)

文档评论(0)

rovend + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档