根据给定的参考类为聚类结果评分。 该节点有两个输入端口,第一个输入端口连接参考类的表,第二个输入端口连接包含聚类结果的表,且这两个表均需要包含类ID。 从对话框中选择两个表中相应的列。成功执行之后,视图中会显示熵值和质量值,其中熵值越小越好,质量值属于[0,1],越趋于1越好。
对话框选项
参考字段
选择第一个输入表中包含参考类的列。
聚类字段
选择第二个输入表中用于评估的字段。
端口
输入端口

0

包含参考类的输入表。

1

包含评估字段的输入表。

输出端口

0

包含每个类的信息熵值的输出表,对应于统计视图的表。最后一行显示整体的统计量值。

视图
统计视图
包含的简单统计量有发现的聚类数量,类对象的数量,参考类的数量和总对象数。 高级统计量包括:
熵:通过相关类大小加权计算所有确定的类的熵值,熵没有标准化,取值可能大于1.
质量:它通过公式(1-标准熵)计算每一个类的质量,然后对每个类值加权求和而得。质量的值域为[0,1]。
表视图展示的统计量有大小、熵、标准化熵和质量。