输入/输出
输入 | 一个输入端口,用于接收前置节点传下来的数据集。 |
---|---|
输出 | 一个输出端口,用于输出增加了离散后的字段的数据集。 |
参数设置
参数名称 | 说明 | 备注 |
---|---|---|
自定义规则 | 区间:以英文逗号分隔离散区间,负无穷为-INF,正无穷为INF。 区间为空时,默认该字段不做离散处理。 | 必填。 区间填写示例:-INF,30,60, 90,INF |
新增列后缀 | 离散后会生成新的字段,默认在原有字段名后追加Buckrizer后缀。该后缀支持修改。 | 后缀默认值为Buckerizer。 |
示例
使用“银行零售客户流失数据”,进行自定义离散化,自定义规则将年龄字段离散区间设置为-INF,20,30, 40,INF,其他字段区间为空,输出结果如下图: