Technology-机器学习-朴素贝叶斯算法

本文介绍朴素贝叶斯算法(Naive Bayesian)。

决策树算法类似于用流程图进行分类判断。

构造

假设有一个数据集，由两类数据组成:

假设任意数据点(x, y)属于类别1的概率为p1(x, y)，属于类别2的概率为p2(x, y),那么判断类别的方式可以为:

贝叶斯决策理论的核心思想:选择高概率对应的类别。

有两桶石头A和B，由灰色和黑色组成:

从B中，取出灰色石头的概率为:

$$P(gray|bucketB) = P(gray\ and\ bucketB) / P(bucketB)$$

其中，$P(gray\ and\ bucketB)$是1/7(B中灰色石头的个数除以两个桶石头的总数), $P(bucketB)$是用3/7，则计算结果为1/3。

贝叶斯准则:如果已知P(x|c)，要求P(c|x),则可用公式:
$$P(c|x) = \frac{P(x|c)P(c)}{P(x)}$$