页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

概述

将连续的属性进行离散化操作,方便数据挖掘处理。用户可自定义规则进行离散化操作。

面板
borderColor#BBBBBB
bgColor#F0F0F0
borderWidth1
borderStylesolid

目录

输入/输出

输入

一个输入端口,用于接收前置节点传下来的数据集。

输出

一个输出端口,用于输出增加了离散后的字段的数据集。

参数设置

参数名称

说明

备注

自定义规则

区间:以英文逗号分隔离散区间,负无穷为-INF,正无穷为INF。

区间为空时,默认该字段不做离散处理。

必填。

区间填写示例:-INF,30,60, 90,INF

新增列后缀

离散后会生成新的字段,默认在原有字段名后追加Buckrizer后缀。该后缀支持修改。

后缀默认值为Buckerizer。

示例

使用“银行零售客户流失数据”,进行自定义离散化,自定义规则将年龄字段离散区间设置为-INF,20,30, 40,INF,其他字段区间为空,输出结果如下图: