对数值型和分层的模糊数据通过自组织的等级树算法进行聚类, 并将聚类树可视化为一个树状图。另外,它为新数据的预测建立一个模型。该训练模型会被SOTA预测节点加载。
可以在SOTA (训练)节点的对话框中设置赢家学习率、同类学习率和继承学习率以调整更能够代表给定数据的类中心:使用最少资源和最小变异限制树的生长;使用最小误差结束周期循环。 选中"使用分类字段",可以使用下方指定的分类字段。该节点会训练分类数据,并将训练模型提供给SOTA预测模型进行分类预测。
更多关于 SOTA聚类的信息可以看: Herrero J., Valencia A., Dopazo J.: A hierarchical unsupervised growing neural network for clustering gene expression patterns。
对话框选项
赢家学习率
设置赢家学习率用于调整更能够代表给定数据的类中心。
同类学习率
设置同类学习率用于调整更能够代表给定数据的同等类中心。
继承学习率
设置继承学习率用于调整更能够代表给定数据的继承类中心。
最小变异
如果选中"使用变异",可以设置最小变异值,作为树停止增长的阀值。如果最小变异值设置为0,则聚类将不会停止直到每一个数据点都成为一个类中心。
最少资源
设置最少资源作为树停止增长的阀值。如果最少资源值设置的很小,如0.01,则聚类将不会停止直到每一个数据点都成为一个类中心。注意,最少资源值不能设置为0.
最小误差
设置最小误差控制每个周期的次数。最小误差值设置的越小,每个周期运算的次数越多。这就意味着,所有类中心的代表就越接近他们的数据。
使用变异
如果想要使用最小变异值阻止树的增长,则选中此项。请注意,最小变异值的计算在聚类大量数据时非常费时。复杂度等于n*n。
距离度量
选择欧式距离或余弦距离测量数据点之间和类中心之间的距离。
使用分层模糊数据
如果选中此项,则必须从右下方的菜单中选择一个字段作为模糊规则的水平,而且要求输入数据至少包括一个整数字段。
分层水平
如果选中此项,将使用分层模糊规则进行聚类,带有模糊规则水平的字段必须从下面菜单中选择。只有整数字段可以被选择其水平。
使用分类字段
选中此项,可以使用下方指定的分类字段。该节点会训练分类数据,并将训练模型提供给SOTA预测模型进行分类预测。此选项要求输入数据至少有一个字符型字段。
分类字段
指定包含分类字段的数据。只能选择分类字段。
端口
输入端口
0 |
包含用于聚类的整数字段的数据表。 |
输出端口
0 |
SOTA聚类算法的训练模型。 |
视图
SOTA树视图
展示SOTA聚类模型的结果。