页面历史

...

数据挖掘的默认界面为‘实验管理’界面，该界面可以进行‘新建实验’：

新建方式1：在文件夹右键菜单‘新建’中单击‘实验’；

新建方式2：单击‘新建实验’。

根据原始数据存放的方式在选择数据源节点，将数据源节点拖拽至画布区域，并在参数面板上进行数据源信息的设置。

特征选择：将‘卡等级’、‘是否为代发客户’、‘月均代发金额’、‘最多代发金额’、‘月初AUM’、‘月均AUM’做为特征列，而‘是否流失’做为标签列；

...

随机森林：本研究用分类算法节点中选择随机森林算法进行预测客户流失的模型构建。

训练：训练节点的输入分为两部分，左边为算法节点，右边为训练数据集，模型通过对训练集数据中特征列的数据进行学习，并根据标签列的数据，确认具有何种特征的数据可能是流失客户，进而使模型获得能够识别流失客户的能力；

预测：预测节点的输入分为两部分，左边为训练好的模型，右边为测试数据集，模型运用识别流失客户的能力，对测试集中的特征列数据进行处理，并获得是否为流失客户的标记，这里的标记是模型给出的结论，并非测试集中标签列的数据。

评估：通过对比模型预测结果与测试集数据之间的差异，可以评价模型的效果。

...

版本比较

关注我们

服务支持