页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

...

字段名数据类型字段解释
客户idstring客户唯一身份标识
卡等级int客户拥有卡的级别,总共分为[1,2,3,4]四个级别
是否为代发客户int1表示为代发客户,0表示为非代发客户
月均代发金额int代发客户的月代发金额平均值
最多代发金额int代发客户代发金额的最大值
月初AUMint客户月初的资产管理规模AUM值
月均AUMint客户资产管理规模AUM的月均值
是否流失int1表示该客户流失,0表示该客户未流失。


1.新建实验

数据挖掘的默认界面为‘实验管理’界面,该界面可以进行‘新建实验’:

新建方式1:在文件夹右键菜单‘新建’中单击‘实验’;

新建方式2:单击‘新建实验’。

2.选择数据源

根据原始数据存放的方式在选择数据源节点,将数据源节点拖拽至画布区域,并在参数面板上进行数据源信息的设置。

3.模型搭建

特征选择:将‘卡等级’、‘是否为代发客户’、‘月均代发金额’、‘最多代发金额’、‘月初AUM’、‘月均AUM’做为特征列,而‘是否流失’做为标签列;

...

随机森林:本研究用分类算法节点中选择 随机森林算法 进行预测客户流失的模型构建。

4.训练&预测

训练:训练节点的输入分为两部分,左边为算法节点,右边为训练数据集,模型通过对训练集数据中特征列的数据进行学习,并根据标签列的数据,确认具有何种特征的数据可能是流失客户,进而使模型获得能够识别流失客户的能力;

预测:预测节点的输入分为两部分,左边为训练好的模型,右边为测试数据集,模型运用识别流失客户的能力,对测试集中的特征列数据进行处理,并获得是否为流失客户的标记,这里的标记是模型给出的结论,并非测试集中标签列的数据。

5.结果评估

评估:通过对比模型预测结果与测试集数据之间的差异,可以评价模型的效果。

...