朴素贝叶斯2| 学习笔记

简介: 快速学习朴素贝叶斯2。

开发者学堂课程【机器学习算法 :朴素贝叶斯2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7277


朴素贝叶斯2

 

一、朴素贝叶斯例子

image.png

以上样本数据表明客户是否购买电脑的信息,记录了客户的年龄、收入层次、是否单身、信用等级等信息。

待预测记录:年龄为老年、收入层次低、不是单身、信用等级一般的人群是否会购买电脑。

有14个样本,每个样本有4个特征,需要注意的是记录标识不会参与到建模和预测当中去。

特征依次为:

年龄:X1={青少年,中年,老年}

收入层次:X2={高,中,低}

是否单身:X3={否,是}

信用等级:X4={一般,良好}

输出有2个分类:Y={是、否}

按照朴素贝叶斯的步骤,

1.学习先验概率:P(Y=Cj),j=1,2.…,k

P(Y=是)=9/14 (14个样本中,包含9个是),同理可得: P(Y=否)=5/14

2. 为了计算联合分布概率,需要计算以下项:

image.png

3.由贝叶斯公式对上式进行处理:

image.png

3. 计算年龄 X1={青少年,中年,老年}:

image.png

将相应数值带进去即可算出年龄为青少年,并且购买电脑的概率为2/9,同理可以算出年龄为青少年,并且不购买电脑的概率为3/5。

同理,可以计算出年龄分别为中年和老年购买以及不购买电脑的概率,分别为:

P(中年|是)=4/9,P(中年|否)=0

P(老年|是)=3/9,P(老年|否)=2/5

4. 计算收入层次 X2={高,中,低}

P(高|是)=2/9,P(高|否)=2/5

P(中|是)=4/9,P(中|否)=2/5

P(低|是)=3/9,P(低|否)=1/5

5. 计算是否单身:X3={否,是}

P(单身|是)=6/9,P(单身|否)=1/5

P(不单身|是)=3/9,P(不单身|否)=4/5

6. 计算信用等级:x4={一般,良好}

P(一般|是)=6/9,P(一般|否)=2/5

P(良好|是)=3/9,P(良好|否)=3/5

7. 待预测记录:

image.png

image.png

将联合概率转换成单个事件概率的乘积整理后得:

image.png

还需计算出,带预测记录属于不购买人群的概率:

image.png

image.png

发现两个式子结果的分母是一样的,只需要计算分子即可,哪个分子大就说明哪个概率大

image.png

得出:待预测记录购买电脑概率正比于分子部分,以及待预测记录不购买电脑概率正比于分子部分。接下来只需要比对分子大小即可。

8. 计算结果:

image.png

将之前所计算出的各项概率结果都一一列出,如上图所示,接下来将两个式子的分子部分所需数据带入,即可比较分子大小。

待预测记录购买电脑概率的分子部分所得出结果为:

9/14*3/9*3/9*3/9*6/9=0.01587302

待预测记录不购买电脑概率的分子部分所得出结果为:

5/14*2/5*1/5*4/5*2/5=0.009142857

所以上方的结果大于下方结果,所以会将待预测结果归结于“是”的结果中,

即:年龄为老年、收入层次低、不是单身、信用等级一般的人群是会购买电脑。

相关文章
|
机器学习/深度学习 人工智能 数据可视化
机器学习:详解贝叶斯网络+例题分析
机器学习:详解贝叶斯网络+例题分析
3442 0
机器学习:详解贝叶斯网络+例题分析
|
存储 机器学习/深度学习 并行计算
一文说清IPython:新手入门指南与实用技巧
一文说清IPython:新手入门指南与实用技巧
527 0
|
机器学习/深度学习 数据采集 存储
通义千问 Qwen 在智能文本分析中的应用实践
本文探讨了通义千问Qwen在智能文本分析的应用,涵盖文本分类、情感分析及关键信息提取,通过具体案例和代码实现,展示了Qwen的强大语言理解能力,为开发者和研究人员提供了实用参考。
|
机器学习/深度学习 PyTorch TensorFlow
Python实现深度学习学习率指数衰减的方法与参数介绍
学习率指数衰减提供了一种高效的动态调整学习率的手段,帮助模型在不同训练阶段以不同的学习速度优化,有利于提升模型性能和训练效率。通过合理设置衰减策略中的参数,可以有效地控制学习率的衰减过程,实现更加精确的模型训练调优。
609 0
蚂蚁金服发布「定损宝」,推动图像定损技术在车险领域的应用
6 月 27 日,蚂蚁金服在北京宣布向保险行业全面开放技术产品「定损宝」,用 AI 技术模拟车险定损环节中的人工作业流程,帮助保险公司实现简单高效的自动定损,成为图像定损技术在车险领域的首次商业应用。
1889 0
蚂蚁金服发布「定损宝」,推动图像定损技术在车险领域的应用
|
机器学习/深度学习 数据采集 开发者
基于机器学习的垃圾邮件过滤系统
基于机器学习的垃圾邮件过滤系统
853 0
|
测试技术 Linux 开发工具
软件测试之【软件测试初级工程师技能点全解】
软件测试之【软件测试初级工程师技能点全解】
493 0
|
存储 安全 内存技术
地址映射
地址映射
741 0
|
Cloud Native 前端开发 关系型数据库
Ganos实时热力聚合查询能力解析与最佳实践
本文主要介绍Ganos实时热力聚合查询并动态输出热力瓦片能力,依托阿里云PolarDB PostgreSQL产品、ADB PostgreSQL和RDS PostgreSQL 三款数据库建设输出。
|
Java Maven 开发工具
Failed to execute goal org.springframework.boot:spring-boot-maven-plugin:2.1.3.RELEASE:repac
Failed to execute goal org.springframework.boot:spring-boot-maven-plugin:2.1.3.RELEASE:repac
264 0