泊松分布 | 学习笔记

简介: 快速学习泊松分布

开发者学堂课程【人工智能必备基础:概率论与数理统计:泊松分布】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7424


泊松分布

内容介绍

一、定义

二、公式

 

一、定义

现实生活多数服从于泊松分布

假设你在一个呼叫中心工作,一天里你大概会接到多少个电话?它可以是任何一个数字。现在,呼叫中心一天的呼叫总数可以用泊松分布来建模。这里有一些例子:

1. 医院在一天内录制的紧急电话的数量。

2. 某个地区在一天内报告的失窃的数量。

3. 在一小时内抵达沙龙的客户人数。

4. 在特定城市上报的自杀人数。

5. 书中每一页打印错误的数量。

泊松分布适用于在随机时间和空间上发事件的情况,其中,我们只关注事件发生的次数。

当以下假设有效时,则称为泊松分布

1.任何一个成功的事件都不应该影响另一个成功的事件。

2.在短时间内成功的概率必须等于在更长的时间范围内成功的概率。

3.时间间隔很小时,在给间隔时间内成功的概率趋向于零。

泊松分布中使用了这些符号:

1. λ 是事件发生的速率。

2. t 是时间间隔的长

3.X 是该时间间隔内的事件数

其中,X 称为泊松随机变量,X 的概率分布称为泊松分布。

令 μ 表示长度为t的间隔中的平均事件数。那么,μ=λt

例如说一个医院中,每个病人来看病都是随机并独立的概率,则该国的一天(或不其他特定时间段,一小时,一周等等】接纳的病人总数可以看作泊松分布的随机变量,但是为什么可以这样处理呢?

通俗定义:假定一个事件在一段时间内随机发生,且符合以下条件:

(1) 将该时间段无限分隔成若干个小的时间段,在这个接近于零的小时间段里, 该事件发生一次的概率与这个极小时间段的长度成正比。

(2)在每一个极小时间段内,该事件发生两次及以上的概率恒等于零。(3)该事件在不同的小时间段里,发生与否相互独立。

则该事件称为 poisson process。这个第二定义就更加利于大家理解了,回到医院的例子之中,如果我们把一天分成 24 个小时,或者 24x60 分钟,或者 24x3600秒。时间分的越短。这个时间段里来病人的概率就越小(比如说医院在正午12点到下午 12 点又一毫秒之间来病人的概率是不是很接近于零?)。

条件一符合,另外如果我们把时间分的很细很细,是不是同时来两个病人(或者两个以上的病人)就是不可能的事件?即使两个病人同时来,也总有一个人先迈步子跨进医院大门吧。条件二也符合。倒是条件三的要求比较苛刻。应用到实际例子中就是说病人们来医院的概率必须是相互独立的,如果不是,则不能看作是 poison 分布。

 

二、公式

image.png

已知平均每小时出生 3 个婴儿,请问下一个小时,会出生几个?

有可能一下了出生 6 个,也有可能一个都不出生。这是我们没法知道的。

泊松分布就是描述某段时间内,事件具体的发生概率。

image.png

上面就是泊松分布的公式。

等号的左边、P 表示概率,N 表示某种函数关系,表示时间,n 表示数量,1 小时内出生 3 个婴儿的概率,就表示为 P(N(1)=3)。

等号右边,λ 表示事件的频率。

接下来两个小时。 一个婴儿都不出生的概率是 0.25%,基本不可能发生。

image.png

接下来一小时,至少出生两个婴儿的概率是 80%

image.png

泊松分布的图形大概是下面的样子

image.png

在  Python 中指定好泊松分布的函数查看图像

image.png

调动 λ 的值

image.png

PMF

image.png

绘制 λ

指定分布的λ值,求出均值,画图

指定 λ=7,得出结果 λ=6.923

image.png

相关文章
|
Ubuntu
ubuntu 软 raid配置
ubuntu 软 raid配置
3111 2
|
安全 网络安全 数据安全/隐私保护
Flask 入门系列教程(六)
Flask 入门系列教程(六)
271 0
|
5月前
|
人工智能 Java Nacos
基于 Nacos + Higress 的 MCP 开发新范式,手把手教程来了!
本文介绍了如何使用 Nacos 3.0.1 与 Higress 配合,实现 HTTP 服务转化为 MCP 协议服务,并支持自动注册与代理。通过 Docker 部署环境,结合 Spring AI Alibaba 框架,可实现服务的自动暴露和动态配置管理,适用于零改造存量应用适配 MCP 协议的场景。
2356 24
|
人工智能
巧妙构建歌词结构:写歌词的技巧和方法之关键,妙笔生词AI智能写歌词软件
在音乐世界里,歌词是灵魂的载体,构建其结构至关重要。优秀的歌词需有引人入胜的开头、条理清晰且富变化的主体,以及深刻难忘的结尾。《妙笔生词智能写歌词软件》提供多种功能,帮助创作者克服结构难题,激发灵感,助你写出打动人心的歌词,开启音乐创作的新篇章。
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
Qwen3:小而强,思深,行速
Qwen3(千问3)于北京时间4月29日凌晨发布,是Qwen系列大型语言模型的最新成员,具备全系列、开源最强、混合推理等特性。它包括两款MoE模型(Qwen3-235B-A22B和Qwen3-30B-A3B)及六个Dense模型,支持119种语言。Qwen3在代码、数学和通用能力测试中超越行业顶尖模型,如DeepSeek-R1和Grok-3。其旗舰版Qwen3-235B-A22B仅需4张H20即可本地部署,成本为DeepSeek-R1的35%。此外,Qwen3原生支持思考模式与非思考模式切换,降低复杂任务门槛,并支持MCP协议优化Agent架构。
6599 1
|
监控 大数据 Java
使用Apache Flink进行大数据实时流处理
Apache Flink是开源流处理框架,擅长低延迟、高吞吐量实时数据流处理。本文深入解析Flink的核心概念、架构(包括客户端、作业管理器、任务管理器和数据源/接收器)和事件时间、窗口、状态管理等特性。通过实战代码展示Flink在词频统计中的应用,讨论其实战挑战与优化。Flink作为大数据处理的关键组件,将持续影响实时处理领域。
2201 5
|
测试技术
po+selenium+unittest自动化测试项目实战
po+selenium+unittest自动化测试项目实战
3010 0
 po+selenium+unittest自动化测试项目实战
|
11月前
|
JSON 监控 API
京东商品列表 API 接口系列(京东 API)
京东商品列表API接口为开发者提供获取店铺内商品详细信息的功能,包括名称、价格、库存、图片、ID、销量等。通过HTTP GET请求并包含必要参数(如店铺ID、API密钥),可获取JSON格式的商品列表数据,适用于展示、库存管理、价格监控等场景。示例代码展示了使用Python调用该接口的方法,返回的数据包含状态码、商品总数、分页信息及具体商品详情。
|
机器学习/深度学习 自然语言处理 语音技术
探索深度学习中的Transformer模型及其在自然语言处理中的应用
探索深度学习中的Transformer模型及其在自然语言处理中的应用
591 5
|
数据处理 Python
使用Pandas解决问题:对比两列数据取最大值的五种方法
​在数据处理和分析中,经常需要比较两个或多个列的值,并取其中的最大值。Pandas库作为Python中数据处理和分析的强大工具,提供了多种灵活的方法来实现这一需求。本文将详细介绍五种使用Pandas对比两列数据并取最大值的方法,通过代码示例和案例分析,帮助新手更好地理解并掌握这些技巧。
812 0