页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

概述

SMOTESynthetic Minority Oversampling Technique),合成少数类过采样技术.它是基于随机过采样算法的一种改进方案。SMOTE算法的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中SMOTE算法通过对少数样本的分析可以合成新的样本,是一种过采样技术。

输入输出


面板
borderColor#BBBBBB
bgColor#F0F0F0
borderWidth1
borderStylesolid

目录



输入

只有一个输入端口,用于接收原始数据集。

输出

只有一个输出端口,用于输出过采样后的全部数据集

参数说明

设置SMOTE的参数:

设置说明如下:

参数

说明

备注

选择标签列

用于选择输入数据集的某一列作为标签列。

单选

标签类别

输入目标列中需要进行SMOTE算法的类别值。

文本框,标签的类别值(必填)

生成样本数

生成指定的个数样本。

文本框,生成的样本数量(必填)

查看分析结果

对生成数据集的目标列类别的聚合统计,如下图: