页面树结构
转至元数据结尾
转至元数据起始

概述

卡方特征选择与特征选择的功能类似,都是用于筛选特征到算法节点。卡方特征选择是根据卡方检验的数据相关性对特征变量进行排序,然后选择与目标变量相关性较大的特征变量。不同之处是卡方特征选择只设置需要选择的特征数量,然后该节点会根据目标字段列自动选择最相关的特征。

输入/输出

输入

一个输入端口,用于接收前置节点传下来的数据集。

输出

一个输出端口,用于输出接收到的数据集。

参数设置

参数名称

说明

备注

选择特征列

用于设置待选择的特征列(人工选择可能相关的特征列)

必填(特征列中不能含有null)

选择标签列

用于设置标签列字段

必填

需选择的特征数量

用于设置从待选择的特征列中输出特征列的数量

必填(范围是[1,已选择特征的数量]的整数)

示例

卡方特征选择中输入和输出的数据集结果一致。

使用“鸢尾花数据”,选择4个特征列和1个标签列以及设置需选择的特征数量为2,根据卡方特征选择的分析结果得出2个最相关的特征。分析结果如下图: