分区

该节点的功能是将数据表随机分为训练集和测试集，训练集用于训练模型，测试集用于测试模型。通过用某个样本生成模型并用另一个样本对模型进行测试，可以预判此模型对类似于当前数据的大型数据集的拟合优劣。
分区节点会生成一个名义字段，其角色默认设置为分区。此外，如果数据中已经存在相应的字段，可以使用"类型"节点将其角色指定为分区，无需再单独使用分区节点生成。一个工作流中只能定义一个分区字段，且一旦有了分区字段，则默认启用分区功能。如果想禁用分区功能，只需要在类型节点中分区字段的角色改为无即可。
对话框选项
分区字段
定义分区字段的名称。
训练分区大小
指定训练分区占总记录数的比例，该值必须是0到100之间的，默认为80。
测试分区大小
指定测试分区占总记录数的比例，该值必须是0到100之间的，默认为20。训练分区大小和测试分区大小的和必须等于100。
使用静态种子
如果希望每次执行的结果分区结果不变，只需要在这里输入固定的随机种子即可。如果不指定，每次执行会使用一个新的随机种子，多次执行的结果可能有所不同。
端口
输入端口

0

输入表

输出端口

0

分区表

关注我们

服务支持

页面树结构

分区