输入 | 只有一个输入端口,用于接收原始数据集。 |
---|---|
输出 | 只有一个输出端口,用于输出过采样后的全部数据集 |
参数说明
设置SMOTE的参数:
参数 | 说明 | 备注 |
---|---|---|
选择标签列 | 用于选择输入数据集的某一列作为标签列。 | 单选 |
标签类别 | 输入目标列中需要进行SMOTE算法的类别值。 | 文本框,标签的类别值(必填) |
生成样本数 | 生成指定的个数样本。 | 文本框,生成的样本数量(必填) |
查看分析结果
对生成数据集的目标列类别的聚合统计,如下图:
SMOTE(Synthetic Minority Oversampling Technique),合成少数类过采样技术.它是基于随机过采样算法的一种改进方案。SMOTE算法的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中
输入 | 只有一个输入端口,用于接收原始数据集。 |
---|---|
输出 | 只有一个输出端口,用于输出过采样后的全部数据集 |
参数说明
设置SMOTE的参数:
参数 | 说明 | 备注 |
---|---|---|
选择标签列 | 用于选择输入数据集的某一列作为标签列。 | 单选 |
标签类别 | 输入目标列中需要进行SMOTE算法的类别值。 | 文本框,标签的类别值(必填) |
生成样本数 | 生成指定的个数样本。 | 文本框,生成的样本数量(必填) |
查看分析结果
对生成数据集的目标列类别的聚合统计,如下图: