逻辑回归可以测量一个分类型目标变量与一个或多个自变量之间的关系。目标字段可以是二分类,也可以是多分类的;自变量可以是数值型的,也可以是分类型的,当自变量为分类型时将转化为多个哑变量进行分析。 逻辑回归可用于研究影响目标字段的因素的重要性、预测和判别。在流行病学中有着广泛的应用,如探索某疾病的危险因素,根据危险因素预测该疾病发生的概率。 该节点的目标字段必须为名义型字段。使用该节点前需要先用一个类型节点指定参与分析的字段的角色,目标字段的角色定义为目标,其他自变量的角色定义为输入。在配置界面选择目标字段的其中一个类别作为参考类别(该类别不参与建模,但可以通过其他类别计算得出该类的预测结果)。 节点可以输出模型的参数估计结果以及PMML格式的模型,在该节点之后配合使用回归预测器节点,可以得出目标字段的预测结果以及目标字段每个类别的预测概率。通过分类评估节点还可以评估预测结果的准确度。 可以从维基百科了解 6.7.2. logistic回归 的更多详细信息。
对话框选项
参考类别
如果目标字段的值域是未知的,参考类别将显示为空。这种情况下,在估计logistic回归之前,需要正确识别目标字段的值域,并选择其中一个类别作为参考类别(默认为最后一个类别)。 在输出结果中,默认目标字段的类别顺序是按字母排序,也可以通过勾选"按值域顺序排序(仅适用于输出结果中类别的顺序)"选择按在值域中的顺序输出结果。 勾选此项只会对输出结果的展示有影响,不会影响模型参数的估计。
端口
输入端口
0 |
执行logistic回归分析的数据表。输入中不能包含缺失值,如果有缺失值,需要提前用缺失值节点填充。 |
输出端口
0 |
Logistic回归预测数据。 |
1 |
逻辑回归模型的系数和相关统计量。 |
2 |
包含模型训练结果的PMML文件,通过连接预测节点可以解析PMML中的模型结果,实现对目标字段进行预测。 |
视图
逻辑回归结果
显示估计的系数和检验结果。注意,当标准误差高的时候,估计的系数会不太可靠。