页面树结构
转至元数据结尾
转至元数据起始

“WOE编码节点”在V9.7版本中新增

概述

WOE编码是评分卡模型常用的数据处理步骤,用于对所选特征值进行WOE编码,并计算IV值,且可根据IV值做特征选择。

输入/输出

输入

一个输入端口,用于接收需要进行WOE编码的数据集。

输出

两个输出端口,输出1是用于输出WOE编码转换后的数据集,输出2WOE编码模型。

参数设置

参数名称

说明

备注

选择列

用于选择进行异常值处理设置的字段。

必填(特征列中不能含有null

分箱方式

  • 分位数分箱:根据设置的数值算出对应的分位数,按照算出的分位数对字段进行分箱。
  • 自定义分箱:用户可以自定义对字段进行分箱的区间。
  • 不参与分箱:该字段不参与分箱。

 

设置

  • 分位数分箱:将字段分成指定个部分,每一部分作为一个箱。比如设置分箱数为4,则计算出25%50%75%3个分位数,将字段分为四个分箱。
  • 自定义分箱:用户自己定义分箱区间。如-INF,500,1000,INF

当分箱方式为“不参与分箱“,这里不需要设置。

选择标签列

选择做为标签列的字段。

必填

 

示例

效果

使用“银行信用贷款预测“,选择”职业“,“婚姻状态”,“教育程度”,“是否有房”,“是否有贷款”,“月”,“是否贷款”这七个字段作为特征列。如下图:

然后通过“特征转换”新增列后缀index,结合“抽取”、“变化”节点之后,生成如下图:

最后接入“WOE编码”节点,即可点击鼠标右键查看分析效果:

到此就完成WOE值和IV值的计算。

  • 无标签