页面树结构
转至元数据结尾
转至元数据起始

标准化节点的功能是对数值型字段进行标准化。在配置对话框中可以选择要标准化的字段,一共有三种标准化方法。选择字段有两种方法:一是"手动选择",通过对话框中的添加或者移除按钮进行操作;二是使用"通配符/正则表达式",通过输入匹配模式,进行字段的选择。
对话框选项
Min-max 标准化
Min-max标准化方法是对原始数据进行线性变换。设minA和maxA分别为属性A的最小值和最大值,将A的一个原始值x通过min-max标准化映射成在区间[0,1]中的值x',其公式为:
新数据=(原数据-最小值)/(最大值-最小值)
Z-score 标准化
这种方法基于原始数据的均值和标准差进行数据的标准化。将A的原始值x使用z-score标准化到x'。z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。
新数据=(原数据-均值)/标准差
z-score标准化方法可以回答这样一个问题:"一个给定值距离平均数多少个标准差"。在平均数之上的值会得到一个正的标准值,在平均数之下的分数会得到一个负的标准值,标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。这是一种可以看出某值在分布中相对位置的方法。标准值能够真实的反应一个值距离平均数的相对标准距离。
小数定标标准化
通过移动数据的小数点位置来进行标准化。小数点移动的位数取决于字段的最大绝对值,直到变换后的最大绝对值小于等于1。然后所有的其他值移动相同的位数。
端口
输入端口

0

输入表

输出端口

0

标准化后的表

  • 无标签