页面树结构
转至元数据结尾
转至元数据起始

正在查看旧版本。 查看 当前版本.

与当前比较 查看页面历史

« 前一个 版本 10 下一个 »

功能概述

关联规则生成,用来输出详尽的关联规则分析指标;它不但可输出 经过FP-Growth算法训练得出的频繁项集、支持度、频率,而且可输出 置信度、提升度、前项、后项及其前后项的个数,以此满足用户不同的关联分析场景。


输入要求

基于FP-Growth训练后的模型

输出说明


序号名称说明业务意义
1

频繁项集

Items

满足支持度最小阈值的所有项集,即频繁项集。可用于发现共现词或者发现事物的热点信息 
2关联规则关联规则形如X→Y的表达式(其中X,Y是不相交的项集),例如{牛奶,尿布}→{啤酒}。关联规则暗示两个物品之间可能存在很强的关系,通俗来说,就是如果 X 发生了,那么 Y 也很有可能会发生。
3

前项

Antecedent

后项

Consequent

对于关联规则X→Y,X称为前项,Y称为后项。


前项数量

Antecedent_quantity

后项数量

Consequent_quantity

例如在{蔬菜罐头,冻肉}→{啤酒}关联规则中,有2个前项,1个后项,属于多对一的关联形式。



4

支持度

Support

支持度是指几个频繁关联的数据在数据集中出现的次数占总数据集的比重。支持度表示在关联规则中出现的频率,支持度高说明物品的需求量大。在实际零售场景中,可通过支持度,置信度,提升度综合指标来看待商品组合,发现高价值关联商品,有助于提升客单价,同时也需要考虑提升度,若是提升度小于1,提升效果有限,商家便可以把精力花在提升度大于1的商品组合
5

置信度

Confidence

置信度是指出现A后又出现B的条件概率,相当于A和B同时出现的概率占A出现概率的比值置信度体现了衡量关联规则的可靠性,置信度高说明物品之间连带紧密。
6提升度
Lift
提升度是指含有X的条件下同时含有Y的概率,与无论是否含X含有Y的概率之比。提升度>1且越高表明正相关性越高,
提升度<1且越低表明负相关性越高,
提升度=1表明没有相关性,即相互独立。
提升度反映了关联规则中的X与Y的相关性,提升度可用来判断商品组合方式是否具有实际价值。

操作指南

(1)基于产品内置的实验案例 "购物篮分析",参考如下GIF演示的步骤,拖拽关联规则生成后,配置最小提升度,便可轻松输出关联规则的相关指标。

(2)结合“过滤”功能,在过滤器中定义针对前项、后项数量的筛选条件,以便筛选出一对一、一对多、多对一、多对多等关联形式。





  • 无标签