第1章 数据分析的基础;1.1 数据分组与变量数列;居民家庭按人口数分组;例1.1 根据抽样调查,某超市某天60位顾客的购货金额数据资料如下(单位:元);记变量值个数为N,组数为m,则斯特吉斯公式为:;3.累计频数和累计频率;4.变量数列分布图;1.概念:分布中心是指距离一个变量的所有值最近的位置。;1.算术平均数(均值);成绩分组(分); 若变量值的个数n为偶数时,则中位数是第 项与第 项变量值的简单算术平均数;(3)组距数列:;购买金额(元);3.众数;算术平均数、中位数和众数三者之间的关系; (2)变量值中出现特别大或特别小的极端数值时分布曲线在图形上不对称。极端值对众数、中位数和算术平均数的影响是不同的,当三者之间的关系是 时,称为正偏分布或右偏分布,如图1;
当三者之间的关系是 时称为负偏分布或左偏分布,如图2.; 在适当偏斜???,众数与中位数的距离约为中位数与算数平均数距离的2倍,即;1.意义
研究变量的次数分布特征出来考察其取值的一般水平的高低
外,还需要进一步考察其各个取值的离散程度。它是变量次数分
布的另外一个重要特征。对其进行测定在实际研究中十分重要的
意义:首先通过对变量取值之间离散程度的测定可以反映各个变
量值之间的差异大小,从而也就可以反映分布中心指标对各个变
量值代表性的高低。其次,通过对变量取值之间离散程度的测
定,可以大致反映变量次数分布密度曲线的形状。;1.极差;2.四分位全距;例:;3.平均差;(2)已分组资料:加权平均法;4.方差和标准差;(2)已分组资料:加权平均法;5.变异系数;例:对30名管理人员的调查表明年平均收入=500,000,标准差=50,000。对30名工人的调查表明年平均收入=32.000,标准差=5.000
;1.4偏度与峰度; 偏度系数就是对数据分布的不对称性(即偏斜程度)的测定。主要包括直观偏度系数和矩偏度系数;;1.峰度的测定;1.下列说法正确的是( )
A.四分位全距和极差一样容易受极端变量值的影响
B.四分位全距充分利用了所有数据的信息
C.标准差的平方称为方差,用来描述变量分布的离散程度
D.方差的平方称为标准差
您可能关注的文档
- 第一章、绪论资料精要.ppt
- 第一章:产业经济学导论(新)资料精要.ppt
- 第八章地形图的测绘和应用资料精要.ppt
- 第一章:混凝土结构材料的性能资料精要.ppt
- 第一章_个人理财概述资料精要.ppt
- 第八章地质编录资料精要.ppt
- 第一章★绪论结构的计算简图资料精要.ppt
- 第八章第四节贵州省的环境保护与资源利用2资料精要.ppt
- 第八章典型案例分析资料精要.ppt
- 第一章MATLAB基础资料精要.ppt
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
原创力文档

文档评论(0)