四、Naive Bayes(朴素贝叶斯)
https://ucc.alicdn.com/images/user-upload-01/2df851ab9a6545e8a32068295a4b7f34.png#pic_center
朴素贝叶斯是一种简单高效的机器学习算法,基于贝叶斯定理,用于分类任务。它被称为“朴素”,因为它假设数据集中的所有特征都是相互独立的,而现实世界数据中的情况并不总是如此。尽管有这样的假设,朴素贝叶斯被发现在许多实际应用中表现良好。
该算法通过使用贝叶斯定理来计算给定输入特征值的给定类别的概率。贝叶斯定理指出,给定一些证据(在本例中为特征值)的假设(在本例中为类别)的概率与给定假设的证据的概率乘以假设的先验概率成正比。朴素贝叶斯算法可以使用不同类型的概率分布(例如高斯分布、多项式分布和伯努利分布)来实现。高斯朴素贝叶斯用于连续数据,多项式朴素贝叶斯用于离散数据,伯努利朴素贝叶斯用于二进制数据。
https://ucc.alicdn.com/images/user-upload-01/5a9dbf7e340e4be689e0e2185722625f.png#pic_center
优点:朴素贝叶斯的主要优点之一是它的简单性和效率。它易于实现,并且比其他算法需要更少的训练数据。它在高维数据集上也表现良好,并且可以处理丢失的数据。
缺点:朴素贝叶斯的主要缺点是假设特征之间的独立性,这在现实世界的数据中通常是不正确的。这可能会导致预测不准确,尤其是当特征高度相关时。此外,朴素贝叶斯对数据集中不相关特征的存在很敏感,这可能会降低其性能。
总结:综上所述,朴素贝叶斯是一种简单高效的机器学习算法,基于贝叶斯定理,用于分类任务。它在高维数据集上表现良好,并且可以处理丢失的数据,但它的主要缺点是假设特征之间的独立性,如果数据不独立,则可能导致预测不准确。
https://ucc.alicdn.com/images/user-upload-01/9519a3af846d4e68a216e3607f06d3da.png#pic_center