Python数据挖掘建模平台操作手册.PDFVIP

  • 0
  • 0
  • 约1.5千字
  • 约 4页
  • 2025-06-09 发布于浙江
  • 举报

Python数据挖掘建模平台操作手册

图118

图119

图120

3.4.2.16数据标准化

图标:

描述:数据标准化处理是将数据按比例缩放,使之落入一个小的特定区间。

字段属性

特征列:选择进行标准化的列,请选择数值型数据,如果勾选了非数值类型数据,则会

自动过滤,下个组件可能无法获取所有列,如图121所示。

66

Python数据挖掘建模平台操作手册

图121

参数设置

标准化方式:标准化方式包括极差标准化、零均值标准化和小数定标标准化,默认零均

值标准化。

最小值:选择极差标准化时有效。

最大值:选择极差标准化时有效。如图122所示

图122

输出

表结果:标准化结果。

报告:无。

示例

下面对某数据进行标准化处理。原数据如图123所示。

67

Python数据挖掘建模平台操作手册

图123

勾选需要进行数据标准化的数据。如图124所示。

选择标准化方式为零均值标准化,如图125所示。

结果如图126所示。

图124

68

Python数据挖掘建模平台操作手册

图125

图126

3.4.2.17衍生变量

图标:

描述:衍生变量是指将一列或多列通过基本运算生成新列。

字段属性

特征列:必选。选择进行衍生变量的列。请选择数值型数据,增加的序列会在勾选的字段

69

文档评论(0)

1亿VIP精品文档

相关文档