输入/输出
输入 | 一个输入端口,用于接收数据集。 |
---|
输出 | 一个输出端口,用于输出空值处理的结果。 |
---|
参数设置
设置空值处理的参数:
设置说明如下:
| |
---|
选择列 | 用于选择进行空值过滤设置的列: |
空值处理 | 用于设置空值的处理类型: - 最大值:使用本列字段的最大值替换空值,适用于数值型字段。
- 最小值:使用本列字段的最小值替换空值,适用于数值型字段。
- 平均值:使用本列字段的平均值替换空值,适用于数值型字段。
- 中位数:使用本列字段的中位数替换空值,适用于数值型字段。
- 按空值百分比删除列:若空值超过设置的百分比,则删除整列;适用于字符、数值型字段。
- 出现频率最多替换:使用本列出现频率最多的值替换空值;适用于字符、数值型字段。
- 指定值:使用设定的值替换空值,适用于字符、数值型字段。
- 过滤整行:只要选定行有空值,就删除该行。
|
值 | 只有空值处理方法为以下两种时才需要进行值的设置: - 按空值百分比删除列:输入百分比;表示空值单元格占该列所有单元格达到指定百分比时,删除该列。
- 指定值:输入具体指;表示以该具体值来显示空值。
|
示例
1、原先数据源存在空值,对其进行空值处理,选择列:number、count ,空值处理为“出现频率最多替换”。
2、输出结果是将空值处理为该列出现频率最多的值,例如number出现频率最多的值为“4”,则空值经过处理后变成“4”;count出现频率最多的值为“100”,则空值经过处理后变成“100”。