该节点使用给定的训练数据创建一个贝叶斯模型。 它为名义型字段计算其所有值的记录数,为数值型字段计算高斯分布概率。生成的PMML模型可以用来连接分类预测器节点以预测未知值。如果有些字段因为数据类型问题被忽略,则会显示一个警告信息。
对话框选项
分类字段唯一取值的最大数
在模型训练期间,唯一取值超过设定值的字段将被忽略。
违约概率
如果赋予给定字段值0概率,则需要被特别关注。如果不调整,0概率会给可能出现的抽象因素一个绝对否决。因此,贝叶斯模型使用一个违约概率参数指定一个很小的违约概率代替0概率。
忽略缺失值
在默认设置中,该节点使用缺失值信息优化预测结果。由于PMML标准不支持这个选项,如果PMML兼容选项被选中并且缺失值被忽略,忽略缺失值选中将不可用。
创建PMML兼容模型
选中该项,则按照PMML 4.2的标准创建模型。PMML 4.2标准忽略缺失值,而且不支持位向量。因此在模型训练期间,位向量字段和缺失值都会被忽略。
即便没有选中该选项,节点依然会创建一个有效的PMML模型。然而该模型包括了一些保存缺失值和位向量信息的特定信息。 分类预测器节点会用这些信息优化预测结果,但是其他 PMML兼容预测模型将忽略这些信息,因而可能导致预测结果的不同。
端口
输入端口

0

训练数据集。

输出端口

0

根据模型得出的预测表。

1

包括各属性统计量(如均值。标准差)的输出表。

2

朴素贝叶斯训练模型。模型可以针对不包括目标字段的数据进行分类预测。 为此,需要从模型输出端口将其连接到分类预测器节点。

视图
朴素贝叶斯视图
视图显示了带有各属性值记录数的训练模型。名义型字段显示其所有值的记录数,数值型字段显示的是高斯分布概率。