《数学建模:基于R》——1.1 数据的描述性分析

简介: 本节书摘来自华章计算机《数学建模:基于R》一书中的第1章,第1.1节,作者 薛毅,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.1 数据的描述性分析

在建立随机模型之前,首先要分析数据的主要特征,也就是数据的数字特征.这些特征通常是均值、方差,或者是数据服从什么分布.只有在确定了这些特征之后,才能建立起符合实际的模型.

本节介绍数据的描述性分析的统计方法,以及完成此类分析的R函数.

1.1.1 数据的数字特征

image
image
image
image
image
image
image
image

1.1.2 随机变量的分布

1.随机变量

从一个总体中抽取不同的样本,分析各个样本所获得的点估计往往不尽相同,这种表现出变异性特征的量称为变量.

在进行统计试验以前,一般并不知道某一试验的确切结果,但是可以赋予试验结果以实际数量的一个函数.因此这一变量称为随机变量.随机变量常用大写字母表示,如X,Y,Z.它们可能出现的具体结果或数值则可用小写字母表示,如x,y,z.

最常见的随机变量有两类.一类是以计数形式表示的随机变量,称为离散型随机变量;另一类是取值在某个有限或无限区间的随机变量,称为连续型随机变量.

2.分布函数

image

3.概率函数与概率密度函数

image

4.分位数

image
image

1.1.3 常用的分布

image
image
image
image
image
image
image

1.1.4 数据的图形描述

可以通过数据的图形描述判断数据的分布情况,比如是否来自于正态分布等.

1.直方图

直方图又称柱状图或质量分布图,是一种统计报告图,由一系列高度不等的纵条纹或线段表示数据的分布情况.直方图是用来展示连续数据分布的常用工具,用来估计数据的概率分布.

image

在R中,hist()函数绘制数据的直方图,其使用格式为

image
image
image
image
image
image
image

相关文章
|
SQL 存储 弹性计算
IRS应用发布之十五:应用安全自测指南
系统使用所有第三方组件必须为最新无已知公开漏洞版本。
|
搜索推荐 芯片 SoC
Windows10系统的安装
Windows 操作系统是最受欢迎的电脑操作系统,现在最新版本是 Windows 10 系统,这篇文章解决如何安装最新版本 Windows 10 操作系统。
1592 0
Windows10系统的安装
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
1139 15
|
网络协议 安全 应用服务中间件
服务器最大支持多少链接数
【10月更文挑战第27天】本文探讨了单台服务器最大支持的链接数,分析了TCP链接标识的四元组、文件句柄限制、端口号范围及多IP绑定等技术细节。结论指出,理论上的最大链接数受制于文件句柄和内存,而链接接收端的链接数可视为无限大。
485 0
|
SQL 关系型数据库 MySQL
MySQL模糊查询二三事
在实际应用中,根据需求和实际数据情况,选择合适的模糊查询方法并优化查询模式,是确保查询效率和准确性的关键。复杂的查询模式往往需要详细的测试和调优,以达到最佳的性能与响应时效。
736 4
|
消息中间件 Prometheus 监控
RabbitMQ性能调优指南
【8月更文第28天】RabbitMQ 是一个非常流行的消息队列中间件,它支持多种消息协议,并且可以轻松集成到各种系统中。随着应用的扩展,确保 RabbitMQ 在高负载环境下能够高效稳定地运行变得至关重要。本文将深入探讨如何通过配置、监控以及最佳实践来优化 RabbitMQ 的性能。
2247 1
|
存储 安全 Java
利用POI多线程导出数据错位解决
通过反射替换解决
960 0
|
存储 分布式计算 Hadoop
Linux/Hbase2.2.2安装教程_单机/伪分布式配置
Linux/Hbase2.2.2安装教程_单机/伪分布式配置
1131 0
Linux/Hbase2.2.2安装教程_单机/伪分布式配置
|
算法
【MATLAB】史上最全的11种数字信号滤波去噪算法全家桶
【MATLAB】史上最全的11种数字信号滤波去噪算法全家桶
6268 0
【MATLAB】史上最全的11种数字信号滤波去噪算法全家桶
|
测试技术 uml 开发者
UML基础与应用之用例视图
UML基础与应用之用例视图
293 0