正太分布 | 学习笔记

简介: 快速学习正太分布

开发者学堂课程【人工智能必备基础:概率论与数理统计:正太分布】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7422


正太分布

一、正态分布

1.正态分布代表了宇宙中大多数情况的运转状态,大量的随机变量被证明是正态分布的。

2.若随机变量X服从一个数学期望为 μ、方差为 σ^2 的正态分布,记为 N(μ,σ^2),其概率密度函数为正态分布的期望值 μ 决定了其位置,其标准差 σ 决定了分布的幅度。

当 μ = 0,σ = 1 时的正态分布是标准正态分布。

公式:

image.png 

μ 为均值

σ 为标准差

3.导入工具包进行图形描绘

#PDF

//密度函数

plt.plot(np.linspace(-4、4,100),

stats.norm.pdf(np.linspace(-4,4,100))/ np.max(stats.norm.pdf(np.linspace(-3,3,100)))

plt.fill_between(np.linspace(-4,4100).stats.norm.pdf(np.linspace(-4,4,100))/np.max(stats.normpdf(np.linspace(-3,3、100))),

alpha= 15,

)

image.png

浮动范围小的可能性比较大

浮动范围大的可能性比较小

4.累积概率密度函数

//把当前结果一步一步的累积起来

# CDF

plt.plot(np.linspace(-4,4,100),

stats.norm.cdf(np.1inspace(-4,4,100)),

#TITLE

//指定范围

plt.text(x=-5,y=1.25,s=Normal Distribution - Overview".

fontsize = 26,weight ='bold’, alpha=75)

plt.text(x=-5,y=1.1,

s = 'Depicted below are the normed probability density function (pdf) and the cumulative densityinfunction (edf) of a nonml! fontsize = 19,alpha=.85)

默认参数

μ =0

σ =1

5.对于不同的 μ 值,表示均值不同,表示图像会左右平移

image.png

6.标准差

σ 意味着偏离程度的多少,值不同会影响它的波动范围,标准差越大,偏离均值会更大一些

image.png

随机的几个样本

可以使用 norm.rvs() 其中默认值 u=0,σ =1,也可以自己指定

In [4]: from scipy.stats import norm

# draw a single sample

print(norm.rvs(size=10),end="\n\n”)

#draw 10  samples

print(normrvs(size=10)end="\n\n")

# adjust mean (‘loc' and standard deviation (‘scale’)

print(norm.rvs(loc=10,scale=0.1),end="\n\n")

1.64481357445

[1.33252376 219487398 -0 12095854 -032972838 -1 4700231

0.71786462

0.30895492 -0.56507026 11402687 084654161]

9.95033612669

概率密度函数

直接 norm.pdf

image.png

7.用累积概率密度计算实际值

累积概率密度函数( Cumulative Probability Density Function )

Format(norm.cdf())

In [6]: from scipy.stats import norm

# probability of x less or equal 0.3

print("P(X<0.3)={}".format(norm.cdf(0.3)))

# probability of x in [-0.2,-0.2]

print("p(-0.2<x<0.2) = {}".format(norm.cdf(0.2)-norm.cdf(-0.2))) P(X<0.3)=0.6179114221889526

P(-0.2<X<0.2)=0.15851941887820603

8.基于数据画出分布

先用柱形图画出来,再用真实的概率分布描述出来,发现两者之间是重合的

image.png

相关文章
|
机器学习/深度学习 算法 数据可视化
智能扑克牌识别软件(Python+YOLOv5深度学习模型+清新界面)
智能扑克牌识别软件(Python+YOLOv5深度学习模型+清新界面)
1764 0
|
TensorFlow 算法框架/工具
【tensorflow】TF1.x保存与读取.pb模型写法介绍
由于TF里面的概念比较接地气,所以用tf1.x保存.pb模型时总是怕有什么操作漏掉了,会造成保存的模型是缺少变量数据或者没有保存图,所以先明确一下:用TF1.x保存模型时只需要保存模型的输入输出的变量(多输入就保存多个),不需要保存中间的变量;用TF1.x加载模型时只需要加载保存的模型,然后读一下输入输出变量(多输入就读多个),不需要初始化(反而会重置掉变量的值)。
351 0
|
缓存 JSON tengine
CDN 预热功能| 学习笔记
快速学习 CDN 预热功能。
|
4月前
|
前端开发 Java 数据库
Java 项目实战从入门到精通 :Java Web 在线商城项目开发指南
本文介绍了一个基于Java Web的在线商城项目,涵盖技术方案与应用实例。项目采用Spring、Spring MVC和MyBatis框架,结合MySQL数据库,实现商品展示、购物车、用户注册登录等核心功能。通过Spring Boot快速搭建项目结构,使用JPA进行数据持久化,并通过Thymeleaf模板展示页面。项目结构清晰,适合Java Web初学者学习与拓展。
363 1
|
12月前
|
数据采集 存储 安全
Pandas数据类型转换:astype与to_numeric
在数据分析中,Pandas的`astype`和`to_numeric`是两种常用的数据类型转换方法。`astype`可将DataFrame或Series中的数据转换为指定类型,支持单一列或多列转换;常见问题包括无效字面量和精度丢失。`to_numeric`主要用于字符串转数值,容错能力强,能自动识别缺失值并优化内存占用。掌握这两种方法及其错误处理技巧,可提高数据分析的效率与准确性。
749 23
|
SQL 数据库 HIVE
hive数仓 ods层增量数据导入
根据业务需求,当表数据量超过10万条时采用增量数据导入,否则全量导入。增量导入基于`create_date`和`modify_date`字段进行,并确保时间字段已建立索引以提升查询效率。避免在索引字段上执行函数操作。创建增量表和全量表,并按日期进行分区。首次导入全量数据,后续每日新增或变更数据保存在增量表中,通过全量表与增量表的合并保持数据一致性。
543 13
|
缓存 运维 NoSQL
二级缓存架构极致提升系统性能
本文详细阐述了如何通过二级缓存架构设计提升高并发下的系统性能。
482 12
|
存储 分布式计算 大数据
MaxCompute 数据分区与生命周期管理
【8月更文第31天】随着大数据分析需求的增长,如何高效地管理和组织数据变得至关重要。阿里云的 MaxCompute(原名 ODPS)是一个专为海量数据设计的计算服务,它提供了丰富的功能来帮助用户管理和优化数据。本文将重点讨论 MaxCompute 中的数据分区策略和生命周期管理方法,并通过具体的代码示例来展示如何实施这些策略。
1047 1
|
分布式计算 DataWorks MaxCompute
DataWorks产品使用合集之怎么更改ODPS表的生命周期为永久
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。