数据挖掘主要页面为实验界面,其中也存在很多工具按钮,接下来为大家做详细介绍。
实验界面
实验界面除了存放节点的‘右侧资源树’,还有‘画布区域’,‘画布工具栏’,‘实验工具栏’,‘参数面板’等,如图:
接下来为大家逐一简单介绍:
右侧资源树
名称 | 说明 | 详细介绍 |
---|---|---|
数据源 | 数据源中的节点是数据挖掘实验数据输入节点,目前有文本数据源,关系数据源,数据集,以及产品内置示例数据源。 | 数据源节点 |
目标源 | 目标源中的节点是数据挖掘实验结果输出节点,目前支持将结果输出至关系目标源,或导出数据到HDFS。 | 目标源节点 |
已训练模型 | 已训练的模型是用户将训练并运行通过后的模型封装保存为节点对象,支持复用,可以简化用户定制工作流的操作。 | |
数据预处理 | 数据预处理中是提供对'脏'数据清洗,初步加工等一系列处理功能的节点,具体内容参考详细介绍。 | 数据预处理节点 |
特征工程 | 特征工程中包括常见特征工程方法节点。通过特征工程,能够最大限度地从原始数据中提取特征,以供算法和模型使用。 | 特征工程节点 |
统计分析 | 统计分析中包括基础数理统计方法,用以数据的分析统计。 | 统计分析节点 |
文本分析 | 文本分析中包括进行文本分析前,对文本数据加工处理的一系列节点。 | 文本分析节点 |
机器学习 | 产品提供常见的机器学习算法节点按照算法类别,分别放在分类算法,回归算法,聚类算法,关联规则文件夹中。而训练,预测,评估均为模型搭建中必须的节点,需搭配算法节点使用。 | 机器学习算法节点 |
脚本模块 | 目前产品提供的算法节点不能够涵盖所有算法,故提供PYTHON脚本、SQL脚本扩展产品的算法能力。 | 脚本节点 |
自定义模块 | 自定义模块存放用户保存自行编写的PYTHON脚本、SQL脚本节点。 | |
服务 | 组合使用服务中的两个节点,可以将数据挖掘实验发布为web服务,提供接口,应用程序可以实时调用数据挖掘实验,并能同步获取执行结果。 | 服务节点 |
实验信息栏
实验信息栏位显示的内容依次为实验名称,导入导出功能按钮,和实验运行情况,如下图:
其中,导入/导出功能介绍如下:
名称 | 说明 |
---|---|
导出流程定义 | 将画布上的实验流程以文件的形式导出。 |
导入流程定义 | 新建空白实验,可以将保存的实验流程文件导入该空白实验,能够实现数据挖掘实验的共享,以及文件形式的备份。 |
画布区域
样式 | 名称 | 说明 |
---|---|---|
放大 | 用于放大画布区域。 | |
缩小 | 用于缩小画布区域。 | |
原始大小 | 复原画布区域至默认大小。 | |
撤销 | 在画布区域进行实验搭建过程中,用于撤销拖拽节点、节点连线等操作。 | |
还原 | 还原相对于撤销而言,对撤销的部分进行还原。 |
注:撤销和还原使用的约束。
实验工具栏
样式 | 名称 | 说明 |
---|---|---|
查看历史 | 实验每次执行的评估结果作为历史信息都被记录下来,在历史信息页面展示,方便用户对比多次实验结果,进而选取出最优实验。 | |
保存 | 该按钮用于保存新建实验、实验流程变动等。 | |
另存为 | 可将实验另存。 | |
运行 | 执行实验流程。 | |
部署服务 | 将数据挖掘实验发布为web服务。 | |
设置模型自学习 | ||
模型批量预测 |
参数面板
参数面板分为两种状态:
- 未选中画布中任何节点:参数面板区域仅有属性页签。
- 选中画布中节点:参数面板区域依次出现参数、属性、帮助三个页签。
由于两种状态的属性页签的作用一致,统一介绍如下:
页签名 | 说明 |
---|---|
参数 | 根据具体节点,显示参数信息。 |
属性 | 可以修改实验或者节点的别名,其中,实验还可以增加描述。 |
帮助 | 具体节点的说明,及作用介绍。 |