这部分主要有两个目的:一是理解字段业务含义,进而理解相应业务;二是探察数据质量,数据的缺失情况和异常情况。可以使用统计节点进行分析。
统计节点配置如下:
各个字段的缺失情况及基本统计量描述如下:
目标字段违约取值描述如下表,从表中可以看出,该数据一共有800个案,其中有517个用户是没有违约的,183个用户有过违约,还有150人不知道是否违约,这也是要待判的,即根据已知是否违约的700用户建立预测模型,预测这150个用户是否违约。执行统计节点后,选择右键菜单下的 查看违约字段的取值情况。
概览
内容工具
活动