该节点根据预定义的聚类数对输入数据进行聚类。每一个数据向量只归属一个类。当中心不在变化时算法会终止执行。聚类算法采用欧氏距离对选中的属性进行距离计算。该节点不会数据进行标准化,如果需要,可以先使用标准化节点进行预处理。k-means 算法基本步骤:1、从 n个数据对象任意选择 k 个对象作为初始聚类中心;2、根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分; 3、重新计算每个(有变化)聚类的均值(中心对象);4、计算标准测度函数,当满足一定条件,如函数收敛时,则算法终止;如果条件不满足则回到步骤(2)。该节点的配置如下:
对话框选项
聚类数
将要创建的聚类数量(类中心数)。
最大迭代数
算法终止后的迭代次数,改善类中心的独立精度。
端口
输入端口

0

聚类的输入数据。所有的数值型字段,也只有数值型字段会参与聚类。

输出端口

0

包含聚类标签的数据表。

1

PMML聚类模型。

视图
聚类视图
以树状结构显示聚类模型,每个节点包含类中心的坐标。