查看源

该节点根据预定义的聚类数对输入数据进行聚类。每一个数据向量只归属一个类。当中心不在变化时算法会终止执行。聚类算法采用欧氏距离对选中的属性进行距离计算。该节点不会数据进行标准化，如果需要，可以先使用标准化节点进行预处理。k-means 算法基本步骤：1、从 n个数据对象任意选择 k 个对象作为初始聚类中心；2、根据每个聚类对象的均值（中心对象），计算每个对象与这些中心对象的距离，并根据最小距离重新对相应对象进行划分； 3、重新计算每个（有变化）聚类的均值（中心对象）；4、计算标准测度函数，当满足一定条件，如函数收敛时，则算法终止；如果条件不满足则回到步骤（2）。该节点的配置如下:
对话框选项
聚类数
将要创建的聚类数量（类中心数）。
最大迭代数
算法终止后的迭代次数,改善类中心的独立精度。
端口
输入端口

0	聚类的输入数据。所有的数值型字段，也只有数值型字段会参与聚类。

输出端口

0	包含聚类标签的数据表。
1	PMML聚类模型。

视图
聚类视图
以树状结构显示聚类模型，每个节点包含类中心的坐标。