页面树结构
转至元数据结尾
转至元数据起始

概述

特征离散的作用是将连续的数据进行等距离散化,就是把连续特征分段,每一段内的原始连续特征无差别的堪称同一个新特征,用户可以根据数据的特征自定义离散区间。

 

 

输入/输出

输入

没有输入端口

输出

一个输出端口,用于接入下一个节点,与抽取节点组合使用。

参数设置

参数名称

说明

备注

离散区间数

选择需要进行离散化的特征列,必须是数值列

必填范围是>=2的整数,默认为10

新增列后缀

离散后会生成新的字段,默认在原有字段名后追加Buckrizer后缀。该后缀支持修改。后缀默认值为Buckerizer

该节点与抽取、变换节点组合使用;

示例

使用“银行零售客户流失”数据,将是否代发客户、月均代发金额、性别、最多代发金额等特征进行等距离散化,结果如下图: