特征离散的作用是将连续的数据进行等距离散化,就是把连续特征分段,每一段内的原始连续特征无差别的堪称同一个新特征,用户可以根据数据的特征自定义离散区间。
输入
没有输入端口
输出
一个输出端口,用于接入下一个节点,与抽取节点组合使用。
参数名称
说明
备注
离散区间数
选择需要进行离散化的特征列,必须是数值列
必填范围是>=2的整数,默认为10
新增列后缀
离散后会生成新的字段,默认在原有字段名后追加Buckrizer后缀。该后缀支持修改。后缀默认值为Buckerizer
该节点与抽取、变换节点组合使用;
使用“银行零售客户流失”数据,将是否代发客户、月均代发金额、性别、最多代发金额等特征进行等距离散化,结果如下图: