回归分析模型主要是揭示事物间相关变量的数量关系,包括线性关系和非线性关系,线性回归模型用来测量变量间的线性关系。 线性回归可以用来研究一个或多个自变量对一个目标字段的影响重要程度,或者对目标字段进行预测。 该模型有着广泛的应用,比如研究人均国民收入对人均消费金额的影响,或者产品的质量等属性对产品满意度的影响等。 该节点的目标字段必须为数值型字段。使用该节点前需要先用一个类型节点指定参与分析的字段的角色,目标字段的角色定义为目标,其他自变量的角色定义为输入。 通过训练, 节点可以输出预测结果、模型的参数估计以及PMML格式的模型,在该节点之后配合使用分类预测器节点,可以得出未知目标字段的预测结果。通过评估节点还可以评估预测效果。 对话框选项
固定截距
默认地回归模型包含截距。勾选这个选项,就会使用指定的常数作为截距。即用户可以在此处自定义截距。
缺失值
选择当数据存在缺失值时仅使用完整记录训练模型还是中止执行。
散点图
指定散点图中展示哪些记录。
端口
输入端口
0 |
执行回归分析的数据表。 |
输出端口
0 |
经过模型得到的预测数据。 |
1 |
线性回归模型的系数和相关统计量。 |
2 |
包含模型训练结果的PMML文件,通过连接预测节点可以解析PMML中的模型结果,实现对目标字段进行预测。 |
视图
线性回归结果
显示估计的系数和模型评估结果。
散点图
散点图用于展示输入数据点和回归线。Y轴为目标字段,X轴为其中一个数值型自变量。 注意:如果有多个自变量,此视图只是一个近似的图。 图中将没有显示在视图中的变量设为平均水平,因此,这个视图在仅有少数自变量时比较准确。