- 80
- 0
- 约2.22千字
- 约 3页
- 2021-05-30 发布于上海
- 举报
欢迎阅读
数据标准化处理方法
??? 在数据分析之前,我们通常需要先将数据标准化( normalization ),利用标准化
后的数据进行数据分析。 数据标准化也就是统计数据的指数化。 数据标准化处理主要包
括数据同趋化处理和无量纲化处理两个方面。 数据同趋化处理主要解决不同性质数据问
题,对不同性质指标直接加总不能正确反映不同作用力的综合结果, 须先考虑改变逆指
标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。 数据
无量纲化处理主要解决数据的可比性。数据标准化的方法有很多种,常用的有“最小—
最大标准化”、 “Z-score 标准化”和“按小数定标标准化”等。经过上述标准化处理,
原始数据均转换为无量纲化指标测评值, 即各指标值都处于同一个数量级别上, 可以进
行综合测评分析。
一、 Min-max 标准化
??? min-max 标准化方法是对原始数据进行线性变换。设 minA 和 maxA分别为属性 A 的
最小值和最大值,将 A 的一个原始值 x 通过 min-max 标准化映射成在区间 [0,1] 中的值
x ,其公式为:
??? 新数据 = (原数据- 极小值) / (极大值- 极小值)
??? 二、 z-score 标准化
??? 这种方法基于原始数据的均值( mean)和标准差( standard deviation )进行数据
的标准化。将 A 的原始值 x 使用 z-score 标准化到 x 。
页脚内容
欢迎阅读
??? z-score 标准化方法适用于属性 A 的最大值和最小值未知的情况,或有超出取值范
围的离群数据的情况。
??? 新数据 = (原数据- 均值) / 标准差
??? spss 默认的标准化方法就是 z-score 标准化。
??? 用 Excel 进行 z-score 标准化的方法: 在 Excel 中没有现成的函数, 需要自己分步
计算,其实标准化的公式很简单。
步骤如下:
??? 1. 求出各变量(指标)的算术平均值(数学期望) xi 和标准差 si ;
??? 2. 进行标准化处理:
????? zij =(xij -xi )/si
????? 其中: zij 为标准化后的变量值; xij 为实际变量值。
??? 3. 将逆指标前的正负号对调。
??? 标准化后的变量值围绕 0 上下波动, 大于 0 说明高于平均水平, 小于 0 说明低于平
均水平。
??? 三、 Decimal scaling 小数定标标准化
页脚内容
欢迎阅读
??? 这种方法通过移动数据的小数点位置来进行标准化。 小数点移动多少位取决于属性
A 的取值中的最大绝对值。 将属性 A 的原始值 x 使用 decimal scaling 标准化到 x 的计
算方法是:
??? x=x/(10*j)
??? 其中, j 是满足条件的最小整数。
??? 例如 假定 A 的值由 -986 到 917,A 的最大绝对值为 986 ,为使用小数定标标准化,
我们用 1000 (即,j=3 )除以每个值,这样, -986 被规范化为 -0.986 。
??? 注意,标准化会对原始数据做出改变,因此需要保存所使用的标准化方法的参数,
以便对后续的数据进行统一的标准化。
??? 除了上面提到
您可能关注的文档
最近下载
- 科达监控平台2.0的介绍及配置.ppt
- 基本能力测验三支一扶考试试题及答案指导(2024年).docx VIP
- 2025-2026学年浙江杭州学军中学高二上学期1月月考数学试卷含详解.docx VIP
- 山东省德州市乐陵市2024-2025学年七年级上学期1月期末数学试题.docx VIP
- 中大班-社会-非遗里的春节-课件(互动版).pptx VIP
- 2023龙岩市物理八年级上册期末试卷.doc
- 山东省德州市乐陵市2024-2025学年七年级上学期1月期末数学试题.docx VIP
- 广东省2025三支一扶考试真题.docx VIP
- 农村三资管理报账流程.pptx VIP
- 3D3S简介桁架87课件讲解.pptx VIP
原创力文档

文档评论(0)