...
名称 | 说明 | 业务意义 | |
---|---|---|---|
频繁项集Items | 满足支持度最小阈值的所有项集,即频繁项集。 | 可用于发现共现词或者发现事物的热点信息 | |
关联规则 | 关联规则暗示两个物品之间可能存在很强的关系。形如A->B的表达式,通俗来说,就是如果 A 发生了,那么 B 也很有可能会发生。 | ||
前项与后项 | 频繁项集可分成前项和后项两部分,然后关联规则前件→后件的置信度 | ||
提升度 Lift | 提升度是指含有X的条件下同时含有Y的概率,与无论是否含X含有Y的概率之比。 | 提升度>1且越高表明正相关性越高, 提升度<1且越低表明负相关性越高, 提升度=1表明没有相关性,即相互独立。 | 提升度反映了关联规则中的X与Y的相关性,提升度可用来判断商品组合方式是否具有实际价值。 |
支持度Support | 支持度是指几个频繁关联的数据在数据集中出现的次数占总数据集的比重。 | 支持度表示在关联规则中出现的频率,支持度高说明物品的需求量大 | |
置信度Confidence | 置信度是指出现A后又出现B的条件概率,相当于A和B同时出现的概率占A出现概率的比值 | 置信度体现了衡量关联规则的可靠性,置信度高说明物品之间连带紧密。 |
...