Page tree
Skip to end of metadata
Go to start of metadata


概述

一种基于概率网络的分类算法,它在朴素贝叶斯定理的基础上取消了关于各属性关于类标号条件独立的苛刻条件,通过各类的先验概率计算待分类样本的后验概率,得到测试样本属于各类别的概率。它对于解决复杂设备不确定性和关联性引起的故障有很大的优势。

示例

使用“城市功能区识别”案例数据,预测城市功能区为专营商业区还是购物中心商业区两类。

其中派生列是为了衍生新的特征方便模型训练效果。

朴素贝叶斯的参数如下:

参数名称

说明

模型类型

Multinomial

表示多项式,此选项为默认选项。

Bernoulli

表示伯努力。对于小数量级的文本数据比较有优势。

选bernoulli需要特征转化成0和1

分类阈值

必填

多分类请用英文逗号隔开,且数量与分类数相同,例如:分三类,示例:8,9,10