功能概述
关联规则生成,用来输出详尽的关联规则分析指标;它不但可输出 经过FP-Growth算法训练得出的频繁项集、支持度、频率,而且可输出 置信度、提升度、前项、后项及其前后项的个数,以此满足用户不同的关联分析场景。
输入要求
基于FP-Growth训练后的模型
输出说明
相关概念
名称 | 定义 | 说明 | 业务意义 |
---|---|---|---|
频繁项集 Items | 满足支持度最小阈值的所有项集,即频繁项集 | 频繁地并且同时出现在交易数据集中的商品的集合 | |
提升度 Lift | 提升度是指含有X的条件下同时含有Y的概率,与无论是否含X含有Y的概率之比。 提升度反映了关联规则中的X与Y的相关性。 | 提升度>1且越高表明正相关性越高, 提升度<1且越低表明负相关性越高, 提升度=1表明没有相关性,即相互独立。 | 提升度可用来判断商品组合方式是否具有实际价值。因此,我们应该尽可能让关联规则的提升度大于1,提升度越大,则应用关联规则的效果越好。 |
置信度用于衡量规则的可靠性 |
操作示例
(1)基于产品内置的实验案例 "购物篮分析",参考如下GIF演示的步骤,拖拽关联规则生成后,配置最小提升度,便可轻松输出关联规则的相关指标。
(2)结合“过滤”功能,在过滤器中定义针对前项、后项的数量的筛选条件,以便筛选出一对一、一对多、多对一、多对多等关联形式。