页面树结构
转至元数据结尾
转至元数据起始


概述

全表统计是对观测数据进行不同的统计分析,可统计信息:样本个数、缺失值个数、平均值、标准差、方差、总和、唯一值、最小值、最大值、上四分位、下四分位、中位数、众数、峰度、偏度等指标;还可使用箱线图和直方图尽可能简单全面表达数据所蕴含的数值范围、分布等信息。

输入/输出

输入

一个输入端口,用于接收数据集

输出

没有输出端口

参数设置

参数名称

说明

备注

选择列

选择需要统计的特征列(列数<=10)

必填

连续数据分桶数

设置连续数据分桶数,分桶数为>=2的整数,统计结果中,数值变量会按照这个分桶数来分箱展示

必填

示例

使用“鸢尾花数据”,选择4个特征进行全表统计,查看分析效果如图: