数据规范化处理方法.pdfVIP

  • 80
  • 0
  • 约2.22千字
  • 约 3页
  • 2021-05-30 发布于上海
  • 举报
欢迎阅读 数据标准化处理方法 ??? 在数据分析之前,我们通常需要先将数据标准化( normalization ),利用标准化 后的数据进行数据分析。 数据标准化也就是统计数据的指数化。 数据标准化处理主要包 括数据同趋化处理和无量纲化处理两个方面。 数据同趋化处理主要解决不同性质数据问 题,对不同性质指标直接加总不能正确反映不同作用力的综合结果, 须先考虑改变逆指 标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。 数据 无量纲化处理主要解决数据的可比性。数据标准化的方法有很多种,常用的有“最小— 最大标准化”、 “Z-score 标准化”和“按小数定标标准化”等。经过上述标准化处理, 原始数据均转换为无量纲化指标测评值, 即各指标值都处于同一个数量级别上, 可以进 行综合测评分析。 一、 Min-max 标准化 ??? min-max 标准化方法是对原始数据进行线性变换。设 minA 和 maxA分别为属性 A 的 最小值和最大值,将 A 的一个原始值 x 通过 min-max 标准化映射成在区间 [0,1] 中的值 x ,其公式为: ??? 新数据 = (原数据- 极小值) / (极大值- 极小值) ??? 二、 z-score 标准化 ??? 这种方法基于原始数据的均值( mean)和标准差( standard deviation )进行数据 的标准化。将 A 的原始值 x 使用 z-score 标准化到 x 。 页脚内容 欢迎阅读 ??? z-score 标准化方法适用于属性 A 的最大值和最小值未知的情况,或有超出取值范 围的离群数据的情况。 ??? 新数据 = (原数据- 均值) / 标准差 ??? spss 默认的标准化方法就是 z-score 标准化。 ??? 用 Excel 进行 z-score 标准化的方法: 在 Excel 中没有现成的函数, 需要自己分步 计算,其实标准化的公式很简单。 步骤如下: ??? 1. 求出各变量(指标)的算术平均值(数学期望) xi 和标准差 si ; ??? 2. 进行标准化处理: ????? zij =(xij -xi )/si ????? 其中: zij 为标准化后的变量值; xij 为实际变量值。 ??? 3. 将逆指标前的正负号对调。 ??? 标准化后的变量值围绕 0 上下波动, 大于 0 说明高于平均水平, 小于 0 说明低于平 均水平。 ??? 三、 Decimal scaling 小数定标标准化 页脚内容 欢迎阅读 ??? 这种方法通过移动数据的小数点位置来进行标准化。 小数点移动多少位取决于属性 A 的取值中的最大绝对值。 将属性 A 的原始值 x 使用 decimal scaling 标准化到 x 的计 算方法是: ??? x=x/(10*j) ??? 其中, j 是满足条件的最小整数。 ??? 例如 假定 A 的值由 -986 到 917,A 的最大绝对值为 986 ,为使用小数定标标准化, 我们用 1000 (即,j=3 )除以每个值,这样, -986 被规范化为 -0.986 。 ??? 注意,标准化会对原始数据做出改变,因此需要保存所使用的标准化方法的参数, 以便对后续的数据进行统一的标准化。 ??? 除了上面提到

文档评论(0)

1亿VIP精品文档

相关文档