...
名称 | 说明 | 详细介绍 |
---|---|---|
数据源 | 数据源中的节点是数据挖掘实验数据输入节点,目前有文本数据源,关系数据源,数据集,以及产品内置示例数据源。 | 数据源节点 |
目标源 | 目标源中的节点是数据挖掘实验结果输出节点,目前支持将结果输出至关系目标源,或导出数据到HDFS。 | 目标源节点 |
已训练模型 | 已训练的模型是用户将训练并运行通过后的模型封装保存为节点对象,支持复用,可以简化用户定制工作流的操作。 | |
数据预处理 | 数据预处理中是提供对'脏'数据清洗,初步加工等一系列处理功能的节点,具体内容参考详细介绍。 | 数据预处理节点 |
特征工程 | 特征工程中包括常见特征工程方法节点。通过特征工程,能够最大限度地从原始数据中提取特征,以供算法和模型使用。 | 特征工程节点 |
统计分析 | 统计分析中包括基础数理统计方法,用以数据的分析统计。 | 统计分析节点 |
评分卡分析 | 评分卡是一种通用的建模框架,将原始数据通过分箱后进行特征工程变换,继而应用于线性模型进行建模的一种方法。 | 评分卡分析 |
文本分析 | 文本分析中包括进行文本分析前,对文本数据加工处理的一系列节点。 | 文本分析节点 |
机器学习 | 产品提供常见的机器学习算法节点按照算法类别,分别放在分类算法,回归算法,聚类算法,关联规则文件夹中。而训练,预测,评估均为模型搭建中必须的节点,需搭配算法节点使用。 | 机器学习算法节点 |
脚本模块 | 目前产品提供的算法节点不能够涵盖所有算法,故提供PYTHON脚本、SQL脚本扩展产品的算法能力。 | 脚本节点 |
自定义模块 | 自定义模块存放用户保存自行编写的PYTHON脚本、SQL脚本节点。 | 自定义模块 |
服务 | 组合使用服务中的两个节点,可以将数据挖掘实验发布为web服务,提供接口,应用程序可以实时调用数据挖掘实验,并能同步获取执行结果。 | 服务节点 |
...
右键菜单 | 说明 | ||
---|---|---|---|
删除 | 表示删除当前节点资源。 | ||
复制 | 复制选中的节点,可以是一个或者多个,与画布右键菜单的“粘贴”节点相结合使用。 | ||
执行到此处 | 表示运行工作流时到当前节点资源结束。 | ||
执行该节点 | 表示单独执行该节点。 | ||
从当前节点开始执行 | 表示运行工作流时从当前节点资源开始执行。 | ||
添加备注 | |||
查看日志 | 用于查看当前节点资源的运行日志。 | ||
查看输出 | 用于查看当前节点资源的输出列表。
| ||
查看分析结果 | 用于查看当前工作流的分析结果。 | ||
模型 | 用于将当前模型保存为“已训练模型”,便于搭建其它工作流时可以直接引用。 | ||
保存脚本 | 用于将当前PYTHON脚本保存到自定义模块下,便于复用。详情请参考 自定义模块。 |
实验工具栏
样式 | 名称 | 说明 |
---|---|---|
查看历史 | 实验每次执行的评估结果作为历史信息都被记录下来,在历史信息页面展示,方便用户对比多次实验结果,进而选取出最优实验。 | |
保存 | 该按钮用于保存新建实验、实验流程变动等。 | |
另存为 | 可将实验另存。 | |
运行 | 执行实验流程。 | |
部署服务 | 将数据挖掘实验发布为web服务。 | |
设置模型自学习 | 发布到生产的服务内所训练的模型,通过模型自学习有可能提高模型准确性。 | |
模型批量预测 | 针对批量的数据,采用服务发布的方式将预测结果数据投放到生产。 |
...