页面树结构
转至元数据结尾
转至元数据起始

类型节点的作用是为了计算字段的元数据,可以在数据源节点的类型选项卡中指定也可在单独的类型节点中指定。其功能主要是为了计算或更新字段的元数据,包字段测量类型、值域和缺失,以及指定字段的角色。比如,分类预测类模型都需要指定一个目标变量,所以必须通过类型节点的角色功能将一个字段的角色指定为目标,将影响因素的角色指定为输入,则模型节点将自动识别字段角色为目标的字段,并将其作为目标变量,而将字段角色为输入的字段将作为自变量参与训练模型。
对话框选项
字段
显示的是输入表中所有的字段名称。
测量
这是测量级别,用于描述某个给定字段中数据的特征。最大的作用是为了放宽对字段存储类型的限制。比如说,通常条形图的分类字段必须为字符型,但是对于一个取值不是很多的整型字段作为分类,统计该字段每个整数值的计数并可视化展现有时也是很合理的,所以通过类型节点无需转换字段的存储类型,只要将该字段的测量类型改为名义型即可以使用条形图进行展现。
注意:字段的测量级别与字段的存储类型不同,后者表明数据是以字符串、整数、实数、日期、时间还是时间戳存储。

此列可以显示所有字段的值域。另外,点击字段相应值域可以弹出选择框,如果将该字段的默认值设置为"读取",类型节点再次执行时将重新计算该字段的元数据,该功能主要用于更新部分字段的元数据。不更新全部字段的元数据,而只更新指定的部分字段可以减少不必要的计算资源浪费。如果您想更新全部字段的元数据,请使用"清除所有值"按钮,这样可以重置读入该节点所有字段的值。此选项可以有效地将所有字段的值设置为读取。
缺失
缺失列用于统计并展示该字段中缺失的计数。这样可以保证模型运算时的数据质量。如果在类型节点中已经统计出字段中是否有缺失值,模型运算时可以提前获知数据集中是否有缺失值,并根据已经指定的缺失值处理方案快速做出响应。
角色
字段的角色共分为目标、输入、分区、分割、记录ID和无6种。角色为目标,表示该字段为目标变量;角色为输入,表示该这些字段为自变量;角色为分区,表示该字段将数据集分为了训练集和测试集,将分别用于训练模型和测试模型;角色为分割,表示数据集将会基于该字段的取值将数据集分割为相应的几份,每一份数据集都将单独训练一个模型;角色为记录ID,表示这个字段为标识型字段,不参与建模;角色为无,表示该字段不参与建模,但是模型预测表中仍保留该字段,这是将字段的角色设置为无与直接使用过滤节点将该字段过滤掉的区别,对于标识分析对象的字段(如客户编码)来说,这个功能特别有用。
端口
输入端口

 0

输入表

输出端口

0

类型表

  • 无标签