- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
定性数据分析
CategoricalDataAnalysis教学内容第一章定性数据第二章分类数据的检验第三章四格表第四章二维列联表第五章高维列联表第六章逻辑斯蒂回归模型什么是定性数据?数据的类型——根据数据的取值来分:1.计量数据(ContinuousData):身高、体重等;取值为任意实数2.计数数据(Counts):职工人数、成交股票数等;取值为非负整数3.名义数据(NominalData):性别、婚姻状况等;取值为属性编码4.有序数据(OrdinalData):文化程度、满意度等;取值为可排序的属性编码定性数据的描述性统计方法有表格法、图示法、数值法1、表格法【例】向50个被访者调查“你最喜欢喝的饮料”,得到表1.1。以上数据经按类别整理后,可得到频数分布表,见表1.2制作有序数据的频数分布表时,还可以统计累积频数和累积频率。如果我们想考察这些饮料受欢迎程度与性别的关系,可以制作饮料与性别的交叉分组表。显然,这种表有利于我们进一步发现受欢迎程度与性别之间的关系。类似地有三种、或更多种方式分组的交叉表,即列联表(contingencytable)。排列图,又叫帕累托图,是按照发生频率大小顺序绘制的条形图;表示有多少结果是由已确认类型或范畴的原因所造成;将出现的质量问题和质量改进项目按照重要程度依次排列而采用的一种图表;可以用来分析质量问题,确定产生质量问题的主要因素。帕累托图(ParetoChart)通常用双坐标系表示,左边纵坐标表示频数,右边纵坐标表示频率,分析线表示累积频率;横坐标表示影响质量的各项因素,按影响程度的大小(即出现频数多少)从左到右排列;通常将累积频率0~80%之间的因素认为是影响质量的主要因素。3、数值法
即用代表性的数值描述定性数据的统计分布特征。代表性的数值有两类:描述定性数据的中心位置描述定性数据的离散程度中心位置:众数、中位数、百分位数离散程度:离异比率、G-S指数、熵众数数据中出现频数最高的数据值,记为mo如上例中,“可口可乐”是众数;适用于定性名义数据中心位置的量度;中位数将数据按一定顺序排列后位于中间的数值,记为me;例:游客对服务态度的评价(%)适用于定性有序数据中心位置的量度。百分位数百分位数是对数据位置的量度,但不一定是中心位置;一般地,第p百分位数是指,至少有p%的数据项小于等于这个值,且至少有(100-p)%的数据项大于等于这个值;第25百分位数称为下四分位数,记为QL,第50百分位数就是中位数,第75百分位数称为上四分位数,记为QU;离异比率用于定性名义数据离散程度的度量,记为V:离异比率越小,说明数据越集中。定性数据离散程度的测度【例】最喜欢的饮料的频数分布表1、用离异比率测度:若将数据稍作调整为:则此外,还可以利用随机变量来刻画定性数据的离散程度;比如,随机变量ξ,可以取等不同的值,相应的概率为即:定性数据离散程度的测度【例】最喜欢的饮料的频数分布表1、用离异比率测度:若将数据稍作调整为:则定性数据离散程度的测度2、用G-S指数测度:调整前,调整后,3、用熵测度:调整前,调整后,定性数据离散程度的测度如果前例中每种饮料的频数相同,那么各自的G-S指数和熵分别为多少呢?当均匀分布时,定性数据的离散程度达到最大G-S指数的最大值为:熵的最大值为:本章小结定性数据的类型运用频数分布表整理数据,并计算频率绘出条形图、饼图、帕累托图描述定性数据的中心位置和离散程度定性数据数据的尺度定类—名义(CategoryScale):只能计次定序—有序(OrdinalScale):计次、排序定距—计数(IntervalScale):计次、排序、加减定比—计量(RatioScale):计次、排序、加减、乘除变量与数据作业自己运用所给数据,对定性数据进行描述统计分析用表、图和数值法对不同的定性数据的分布情况进行比较第一章定性数据定性数据的概念定性数据的描述性统计表格法名义数据频数频率分布表有序数据频数频率分布、累积频数频率表图示法条形图圆形图(饼形图)排列图(Pareto图)绘制应用数值法-分布中心名义数据:众数有序数据:众数、中位数、百分位数第P
您可能关注的文档
- 习作:介绍一种事物.pptx
- 第三章-时间频率计量.ppt
- 植物拉丁学名改错.ppt
- 库尔勒课题报告.pptx
- IT硬件行业介绍.ppt
- 第三讲-基本假设和参数的估计.ppt
- 第2章-力系的简化.ppt
- 公共关系英文版2.ppt
- 国家治理的简约主义.pptx
- 区域活动出入卡.ppt
- 基本面选股组合月报:大模型AI选股组合本年超额收益达6.60.pdf
- 可转债打新系列:安集转债,高端半导体材料供应商.pdf
- 可转债打新系列:伟测转债,国内头部第三方IC测试企业.pdf
- 联想集团PC换机周期下的价值重估.pdf
- 计算机行业跟踪:关税升级,国产突围.pdf
- 科技类指数基金专题研究报告:详解AI产业链指数及基金布局.pdf
- 计算机行业研究:AIAgent产品持续发布,关税对板块业绩影响较小.pdf
- 民士达深度报告:国内芳纶纸龙头,把握变局期崛起机遇.pdf
- 社会服务行业动态:全球首张民用无人驾驶载人航空器运营合格证落地,霸王茶姬冲击美股IPO.pdf
- 通信行业研究:特朗普关税令落地,长期看好国产算力链.pdf
最近下载
- 日本化妆品标准(中英文对照版).pdf
- 2025湖南湘潭医卫职业技术学院招聘11人笔试备考题库及答案解析.docx
- 【精选】SOUNDCHECK使用说明.pdf
- 江苏省基本医疗保险诊疗项目和医疗服务设施范围及支付标准、医疗保险特殊医用材料目录( 20210419)公示版.pdf VIP
- 浙江专用2025版高考历史大二轮复习板块综合二世界简史二近代世界文明学案.doc VIP
- 浙江专用2025版高考历史大二轮复习板块综合二世界简史三现代世界文明学案.doc VIP
- 79博客-目录书签跳转版.pdf VIP
- 西南18J412 阳台 外廊 楼梯栏杆.pdf
- 销售人员培训师求职个人简历求职简历大学生优秀简历模板.doc VIP
- 2023年部编版道德与法治六年级小升初模拟题及答案(共3套) .pdf VIP
文档评论(0)