页面树结构
转至元数据结尾
转至元数据起始

概述

PCA(主成分分析)是统计学上一种常用的方法,主要用来对高维数据进行降维,通过对多个维度进行线性组合,获得较少且能够描述数据特征的主成分指标,减少由于数据维度过多带来的庞大计算量,降低算法的复杂度,使用最少数量的主成分来解释最大量的方差。因为它可减少变量数目以此避免多重共线性,适用于预测变量较多大于观测值数目的情况。

输入/输出

输入

一个输入端口,用于接收前置节点传下来的数据集。

输出

一个输出端口,用于输出接收到的数据集。

参数设置

参数名称

说明

备注

选择特征列

用于设置待选择的特征列

必填(特征列中不能含有null)

需选择的特征数量

从待选择的特征列中输出特征列的数量

必填范围是[1,已选择特征的数量]的整数,默认值为1

示例

使用“鸢尾花数据”,选择4个特征列和设置需选择的特征数量为2,则输出的结果为2个主成分指标。结果如下图: