页面树结构
转至元数据结尾
转至元数据起始

该节点的功能是将数据表随机分为训练集和测试集,训练集用于训练模型,测试集用于测试模型。通过用某个样本生成模型并用另一个样本对模型进行测试,可以预判此模型对类似于当前数据的大型数据集的拟合优劣。
分区节点会生成一个名义字段,其角色默认设置为分区。此外,如果数据中已经存在相应的字段,可以使用"类型"节点将其角色指定为分区,无需再单独使用分区节点生成。一个工作流中只能定义一个分区字段, 且一旦有了分区字段,则默认启用分区功能。如果想禁用分区功能,只需要在类型节点中分区字段的角色改为无即可。
对话框选项
分区字段
定义分区字段的名称。
训练分区大小
指定训练分区占总记录数的比例,该值必须是0到100之间的,默认为80。
测试分区大小
指定测试分区占总记录数的比例,该值必须是0到100之间的,默认为20。训练分区大小和测试分区大小的和必须等于100。
使用静态种子
如果希望每次执行的结果分区结果不变,只需要在这里输入固定的随机种子即可。如果不指定,每次执行会使用一个新的随机种子,多次执行的结果可能有所不同。
端口
输入端口

0

输入表

输出端口

0

分区表

  • 无标签