...
实验界面除了存放节点的‘右侧资源树’,还有‘画布区域’、‘画布右键菜单’、‘节点右键菜单’、‘画布工具栏’、‘实验工具栏’、‘参数面板’等,如图:
接下来为大家逐一简单介绍:
右侧资源树
名称 | 说明 | 详细介绍 |
---|---|---|
数据源 | 数据源中的节点是数据挖掘实验数据输入节点,目前有文本数据源,关系数据源,数据集,以及产品内置示例数据源。 | 数据源节点 |
目标源 | 目标源中的节点是数据挖掘实验结果输出节点,目前支持将结果输出至关系目标源,或导出数据到HDFS。 | 目标源节点 |
已训练模型 | 已训练的模型是用户将训练并运行通过后的模型封装保存为节点对象,支持复用,可以简化用户定制工作流的操作。 | |
数据预处理 | 数据预处理中是提供对'脏'数据清洗,初步加工等一系列处理功能的节点,具体内容参考详细介绍。 | 数据预处理节点 |
特征工程 | 特征工程中包括常见特征工程方法节点。通过特征工程,能够最大限度地从原始数据中提取特征,以供算法和模型使用。 | 特征工程节点 |
统计分析 | 统计分析中包括基础数理统计方法,用以数据的分析统计。 | 统计分析节点 |
评分卡分析 | 评分卡是一种通用的建模框架,将原始数据通过分箱后进行特征工程变换,继而应用于线性模型进行建模的一种方法。 | 评分卡分析 |
文本分析 | 文本分析中包括进行文本分析前,对文本数据加工处理的一系列节点。 | 文本分析节点 |
机器学习 | 产品提供常见的机器学习算法节点按照算法类别,分别放在分类算法,回归算法,聚类算法,关联规则文件夹中。而训练,预测,评估均为模型搭建中必须的节点,需搭配算法节点使用。 | 机器学习算法节点 |
脚本模块 | 目前产品提供的算法节点不能够涵盖所有算法,故提供PYTHON脚本、SQL脚本扩展产品的算法能力。 | 脚本节点 |
自定义模块 | 自定义模块存放用户保存自行编写的PYTHON脚本、SQL脚本节点。 | 自定义模块 |
服务 | 组合使用服务中的两个节点,可以将数据挖掘实验发布为web服务,提供接口,应用程序可以实时调用数据挖掘实验,并能同步获取执行结果。 | 服务节点 |
实验信息栏
实验信息栏位显示的内容依次为实验名称,导入导出功能按钮,和实验运行情况,如下图:
...