功能概述
关联规则生成,用来输出详尽的关联规则分析指标;它不但可输出 经过FP-Growth算法训练得出的频繁项集、支持度、频率,而且可输出 置信度、提升度、前项、后项及其前后项的个数,以此满足用户不同的关联分析场景。
输入要求
关联规则生成,是基于FP-Growth训练后的模型使用的。
...
1. 功能概述
关联规则生成,基于FP-Growth 训练后的模型输入后,能够输出详尽的关联规则分析指标: 频繁项集、支持度、频率、 置信度、提升度、前项、后项及其数量。
2. 功能输出说明
序号 | 名称 | 说明 | 业务意义 | ||
---|---|---|---|---|---|
1 | 关联规则 | 关联规则形如X→Y的表达式(其中X,Y是不相交的项集),例如{牛奶,尿布}→{啤酒}。 | 关联规则暗示两个物品之间可能存在很强的关系,通俗来说,就是如果 X 发生了,那么 Y 也很有可能会发生。 | ||
2 | 前项 Antecedent 后项 Consequent | 对于关联规则X→Y,X称为前项,Y称为后项。 | 前项数量 Antecedent_quantity 后项数量 Consequent_quantity | 例如在{蔬菜罐头,冻肉}→{啤酒}关联规则中,有2个前项,1个后项,属于多对一的关联形式。 | |
3 | 提升度 Lift | 提升度是指含有X的条件下同时含有Y的概率,与无论是否含X含有Y的概率之比。 | 提升度>1且越高表明正相关性越高, 提升度<1且越低表明负相关性越高, 提升度=1表明没有相关性,即相互独立。 | 提升度反映了关联规则中的X与Y的相关性,提升度可用来判断商品组合方式是否具有实际价值。 | 在实际零售场景中,除了通过支持度,置信度来看待商品组合,发现高价值关联商品,同时也需要考虑提升度,若是提升度小于1,提升效果有限,商家便可以把精力花在提升度大于1的商品组合 |
...
关于频繁项集、支持度、置信度的说明,点击 此处 可查阅。
3. 应用示例
3.1 场景说明
我们可以基于产品内置的购物篮分析案例,通过发现在交易数据库中不同商品之间的关联规则,有助发现顾客购买行为,指导企业进行科学的商业活动。
...
...
- 如下图的输出数据中,{冻肉,啤酒} → {蔬菜罐头}
...
- 这组关联商品的置信度、提升度最高,说明冻肉、啤酒和蔬菜罐头出现在同一购物篮的概率非常高(可信度达到89%),说明买了冻肉和啤酒的用户,很有可能购买蔬菜罐头。
...
- 商家可以考虑采取特殊的市场推广活动或手段(给买冻肉和啤酒、蔬菜罐头的客户打折)、货架设计(蔬菜罐头放在冻肉和啤酒相邻位置)等。
- 当然还有很多其他结论,可以帮助我们对商品的销售进行分析和处理,有利于提高商品销量,实现数据价值。
3.2 操作步骤
...
(1)在实验管理中,选择产品内置的实验案例 " 购物篮分析 ",参考如下GIF演示的步骤,拖拽 关联规则生成 后,配置 最小提升度,便可轻松输出关联规则的相关指标。
...
(2)结合“过滤
...
”功能,在过滤器中定义针对前项、后项的数量,以便筛选出一对一、一对多、多对一、多对多等关联形式。如下图所示,通过SQL语句定义筛选条件:前项数量大于1、后项数量为1。