- 5
- 0
- 约1.18万字
- 约 59页
- 2017-03-22 发布于湖北
- 举报
trimmed mean:截尾均值 * 定类变量、定序变量、定距变量,定比变量: 定类变量:是指变量的取值即变量值只有类别属性之分,而没有大小、优劣之别。 定序变量:是指变量的取值,即变量值,除了有类别属性之分外,还有等级或次序的区别。 定距变量:是指变量的取值即变量值,除了具有类别、次序区别之外,还有类别之间、序列之间的标准化距离的变量。 定比变量:是指变量的取值,即变量值除具有定类、定序、定距等特征外,在变量取值中还有一个真正的零的变量即为定比变量。 * 用Pearsons卡方统计量进行统计检验时应注意的问题: 列联表的卡方检验用于检验两个分类变量的关联程度。卡方数值的大小与样本容量有关,在卡方检验中,需要报告关联系数;并且,在实际应用中还需注意卡方检验的条件,在有20%以上的理论次数小于5或有理论次数小于1时不能应用卡方检验;此外,在两个变量都是顺序变量时,两个变量的关联程度用Gamma检验比用卡方检验更好。 * * 通过箱图(Boxplots)描述数据分布 奇异值: 某个数据距离箱体主体边缘的距离超过箱主体高度的1.5倍,称为奇异值,在箱图中用○表示。奇异值分为上奇异值和下奇异值。 极端值: 某个数据距离箱体主体边缘的距离超过箱主体高度的3倍,称为极端值,在箱图中用★表示。极端值分为上极端值和下极端值。 五、探索性分析 通过箱图(
原创力文档

文档评论(0)