数据的无量纲化处理及示例.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据得无量纲处理方法及示例

在对实际问题建模过程中,特别就是在建立指标评价体系时,常常会面临不同类型得数据处理及融合。而各个指标之间由于计量单位与数量级得不尽相同,从而使得各指标间不具有可比性。在数据分析之前,通常需要先将数据规范化,利用规范化后得数据进行分析.数据规范化处理主要包括同趋化处理与无量纲化处理两个方面.数据得同趋化处理主要解决不同性质得数据问题,对不同性质指标直接累加不能正确反应不同作用力得综合结果,须先考虑改变逆指标数据性质,使所有指标对评价体系得作用力同趋化。数据无量纲化主要解决数据得不可比性,在此处主要介绍几种数据得无量纲化得处理方式。

(1)极值化方法

可以选择如下得三种方式:

(A)

即每一个变量除以该变量取值得全距,规范化后得每个变量得取值范围限于[-1,1]。

(B)

即每一个变量与变量最小值之差除以该变量取值得全距,规范化后各变量得取值范围限于[0,1]。

(C),即每一个变量值除以该变量取值得最大值,规范化后使变量得最大取值为1。

采用极值化方法对变量数据无量纲化就是通过变量取值得最大值与最小值将原始数据转换为界于某一特定范围得数据,从而消除量纲与数量级得影响。由于极值化方法对变量无量纲化过程中仅仅对该变量得最大值与最小值这两个极端值有关,而与其她取值无关,这使得该方法在改变各变量权重时过分依赖两个极端取值。

(2)规范化方法

利用来计算,即每一个变量值与其平均值之差除以该变量得规范差,无量纲化后各变量得平均值为0,规范差为1,从而消除量纲与数量级得影响.虽然该方法在无量纲化过程中利用了所有得数据信息,但就是该方法在无量纲化后不仅使得转换后得各变量均值相同,且规范差也相同,即无量纲化得同时还消除了各变量在变异程度上得差异.

(3)均值化方法

计算公式为:,该方法在消除量纲与数量级影响得同时,保留了各变量取值差异程度上得信息。

(4)规范差化方法

计算公式为:。该方法就是规范化方法得基础上得一种变形,两者得差别仅在无量纲化后各变量得均值上,规范化方法处理后各变量得均值为0,而规范差化方法处理后各变量均值为原始变量均值与规范差得比值。

综上所述,针对不同类型得数据,可以选择相应得无量纲化方法。如下得示例就就是一个典型得评价体系中无量纲化得范例.

示例:近年来我国淡水湖水质富营养化得污染日益严重,如何对湖泊水质得富营养化进行综合评价与治理就是摆在我们面前得任务,下面两个表格分别为我国5个湖泊得实测数据与湖泊水质评价规范。

表2-2全国五个主要湖泊评价参数得实测数据

总磷(mg/L)

耗氧量(mg/L)

透明度(m)

总氨(mg/L)

杭州西湖

130

10、30

0、35

2、76

武汉东湖

105

10、70

0、40

2、0

青海湖

20

1、4

4、5

0、22

巢湖

30

6、26

0、25

1、67

滇池

20

10、13

0、50

0、23

表2-3湖泊水质评价规范

评价参数

极贫营养

贫营养

中营养

富营养

极富营养

总磷

<1

4

23

110

660

耗氧量

0、09

0、36

1、80

7、10

〉27、1

透明度

37

12

2、4

0、55

<0、17

总氨

〈0、02

0、06

0、31

1、20

4、6

要求:(1)试用以上数据,分析总磷,耗氧量,透明度,总氨这4个指标对湖泊水质评价富营养化得作用。

(2)对这5个湖泊得水质综合评价,确定水质等级。

在进行综合评价之前,首先要对评价得指标进行分析。通常评价指标分成效益型,成本型与固定型指标。效益型指标就是指那些数值越大影响力越大得统计指标(也称正向型指标);成本型指标就是指数值越小越好得指标(也称逆向型指标);而固定型指标就是指数值越接近于某个常数越好得指标(也称适度型指标)。如果每个评价指标得属性不一样,则在综合评价时就容易发生偏差,必须先对各评价指标统一属性。

建模步骤

(ⅰ)建立无量纲化实测数据矩阵与评价规范矩阵,其中实测数据矩阵与等级规范矩阵如下,

,,

然后建立无量纲化实测数据矩阵与无量纲化等级规范矩阵,其中

得到

(ⅱ)计算各评价指标得权重

计算矩阵B得各行向量得均值与规范差,

然后计算变异系数

,

最后对变异系数归一化得到各指标得权重为

(ⅲ)建立各湖泊水质得综合评价模型

通常可以利用向量之间得距离来衡量两个向量之间得接近程度,在Matlab中,有以下得函数命令来计算向量之间得距离;

dist():计算中得每个行向量与中每个列向量之间得欧式距离;

mandist():绝对值距离.

计算中各行向量到中各列向量之间得欧氏距离,

若,则第个湖泊属于第级。

这说明杭州西湖,武汉东湖都属于极富营养水质,青海湖属于中营养水质,而巢湖与滇池属于富营养水质。

同时也可以

文档评论(0)

可爱的家人6536 + 关注
实名认证
文档贡献者

可爱的家人

1亿VIP精品文档

相关文档