页面树结构
转至元数据结尾
转至元数据起始

正在查看旧版本。 查看 当前版本.

与当前比较 查看页面历史

« 前一个 版本 4 下一个 »

概述

频繁模式,是找出数据集中共现概率大于阈值的事务。用法跟分类算法类似,先根据训练集,训练出所有的频繁项,在对测试集进行频繁项预测。

示例

使用“购物篮分析”案例数据,预测用户购买了物品1可能会购买物品2的可能性。

FP-Growth参数如下:

参数名称

说明

最小支持度

参数范围:[0,1]的小数,默认值为0.01

支持度,代表项集的频繁程度;最小支持度作为支持度的阈值,满足最小支持度的项集才会输出;

最小置信度

参数范围:[0,1]的小数,默认值为0.01

置信度,代表包含A事务中同时包含B事务的频繁程度;最小置信度作为置信度的阈值,满足最小置信度的项集才会输出;

例如:有以下项集

项集{牛奶,尿布,啤酒}的

1、支持度,

2、置信度,

  • 无标签