查看源

该节点应用一个相关分析节点的模型评估哪些字段是多余的（即强相关的）并且剔除他们。输出表中只包含剔除后的字段。
过滤步骤大致如下：根据对话框中设置的相关系数阀值确定相关模型中有相互关系的字段数量。相关性最高的字段将会"幸存"，其它相关的字段将会过滤掉。程序会被重复执行直到没有可以识别的字段为止。寻找满足约束条件的最小变量集的问题是很难解决的，然而这个方法可以充分接近目标。
对话框选项
模型字段
显示模型中包含的变量集合。而且输入表中也必须包含这些变量。列表中自动选择规则会被展示在输出表中，而且这个列表不能被编辑。
相关系数阀值
在这里指定相关系数阀值。值越大，被过滤掉的变量越少。点击"计算"按钮可以预览过滤后的变量。
计算
点击这个按钮可以更新统计量的值。它可以使用上述程序计算得到缩减后的变量集。
端口
输入端口

0	来自相关分析节点的模型。
1	准备过滤的数值型输入表。（它必须包含参与建立相关模型的所有字段）

输出端口

0	对输入表进行过滤的数据表。