分类变量的描述统计.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

描述统计主要分为分类变量(categoricalvariables)的描述统计和数值型变量(quantitativevariables)的描述统计,本讲先讨论分类变量的描述统计。第1讲分类变量的描述统计1

知识结构图分类变量单变量分类数据双变量分类数据一维频数分布表条形图累积频数分布图点图帕累托图饼图列联表(二维表)对比条形图条件相对频数图两个变量的关系(独立)辛普生悖论(潜在变量)

变量的类型频数分布表两个分类变量的关系主要内容

12用频数分布表描述数据的分布用点图、条形图等图形来展示数据用列联表分析两个分类变量之间的关系【学习目标】:掌握用条件相对频数表示的对比条形图两个分类变量是否独立【重难点】:学习目标及重难点

1.1变量的类型变量(variable)是指一个可以取两个或更多个可能值的特征、特质或属性。比如,性别是取两个值的变量,因为一个人只可能是男性或女性。还有其它变量的例子,如人的寿命,体重,以及汽车每升汽油所能行驶的距离,等等。图1.1变量的类型

1.1变量的类型变量主要有如下两种类型:1.分类变量(Categoricalvariables)表现为不同的类别如“性别”、“企业所属的行业”、“学生所在的学院”等分类变量可以分为不可排序的(“性别”)和可以排序的(“产品等级”)分类变量的观察结果就是分类数据(categoricaldata)2.数值型变量(Quantitativevariables)可以用阿拉伯数据来记录其观察结果如“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”数值型变量的观察结果称为数值型数据(metricdata)

几个概念:频数(frequency):落在某一特定类别中的数据的个数。相对频数(relativefrequency):落在某一特定类别中的数据的个数除以样本数据总数。123654频数表是遵循既不重叠又不遗漏的原则,按变量(数据特征)的取值归类分组,把总体的所有单位按组归并排列,其各个组别所包含的数据数目(频数)的汇总表格。简而言之,频数表包括两个要素:总体按其标志所分的组和各组所分布的单位数量。频数表(frequencytable)或频数分布表(frequencydistributiontable)可以帮助了解变量取值的分布状况。百分比频数(percentagefrequency):相对频数乘以100%。1.2频数分布表

1.2频数分布表表1.1是一家超市某天50名顾客购买饮料品牌的频数分布表表1.1频数分布表品牌名称频数频率百分比频数百事可乐90.1818%汇源果汁60.1212%可口可乐150.330%露露90.1818%旭日升冰茶110.2222%

对于另一种可排序的分类数据,我们还可以做累积频数表(cumulativefrequencytable)。01累积方法有两种:一种是从类别顺序的开始一方向最后一方累积频数,称为“向上累积”;一种是从类别顺序的最后一方向开始一方累计频数,称为“向下累积”。02累积频数(Cumulativefrequency):各类别频数的逐级累加03累积频率(Cumulativepercentage):各类别频率(百分比)的逐级累加041.2频数分布表

1.2频数分布表表1.2是住房满意度调查的累积频数分布表表1.2累积频数分布表某城市家庭对住房状况评价的频数分布回答类别向上累积向下累积频数百分比频数%累积频数累积百分比%累积频数累积百分比%非常不满意248248300100不满意108361324427692一般93312257516856满意4515270907525非常满意30103001003010Total300100————

1.2频数分布表我们也可以做它的累积频数分布图图1.2累积频数分布图

图形展示01想获得更生动的展示,可以使用统计图。利用统计图表现统计数据,能更加鲜明、一目了然、形象具体地显示现象之间的相互关系。分类数据的展示主要有点图(dotplot)、条形图(barchart)和饼图(piechart),点图和条形图本质上是相同的。02[Note]所有分布图的横轴是变量的取值,纵轴是频数或频率。031.2频数分布表

1.2频数分布表(1)点图图1.3饮料的点图(2)条形图条形图是用宽度相同的柱子的高度或长短来表示各类别数据的图形图1.4饮料的条形图

1.2频数分布表图1.5饮料的帕累托图帕累托图帕累托图就是把普通条形图中每个变量的取值出现的频数从左到右、从大到小排列。帕累托图表明,该商店主要销售的饮料为可口可乐和旭日升冰茶。

1.2频数分

文档评论(0)

SYWL2019 + 关注
官方认证
文档贡献者

权威、专业、丰富

认证主体四川尚阅网络信息科技有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510100MA6716HC2Y

1亿VIP精品文档

相关文档