回归分析概述 | 学习笔记

简介: 快速学习回归分析概述

开发者学堂课程【人工智能必备基础:概率论与数理统计:回归分析概述】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7428


回归分析概述

内容介绍:

一、 回归分析

二、 回归的一般步骤

 

一、回归分析

相关分析是研究两个或两个以上的变量之间相关程度及大小的一种统计方法

回归分析是寻找存在相关关系的变量间的数学表达式,并进行统计推断的一种统计方法
在对回归分析进行分类时,主要有两种分类方式:
●根据变量的数目,可以分类一元回归、多元回归(一元回归:比如有个 Y,X。X 会对 Y 产生一个影响,Y 只由 X 一个因素影响而改变的。多元回归:比如有 Y、X0、X1、X2,变量很多,但因变量只有一个 Y。)
●根据自变量与因变量的表现形式,分为线性与非线性(基本线性表达:y=kx+b。还有 y=kx^2+b,以及二阶的,三阶的,四阶的……)
所以,回归分析包括四个方向:一元线性回归分析、 多元线性回归分析、一元非线性回归分析、多元非线性回归分析。

image.png

解读上图:球里有些数据点(红色方块),现要围绕已知的数据点建立出一个回归方程,这个回归方程能把这些数据点综合进去,这就是回归分析里的主要的事。假如把回归方程(紫色线)构建出来,有些点在紫色线的上面,有些在紫色线的下面,这就是离散情况,既分布在回归方程两端。在回归方程上的点叫做估计值或预测值,基于方程的点,在方程上的点是预测值。比如想要知道一个指标,现横坐标和纵坐标分别表示体重和身高,现当体重等于 68,这类人身高大约为多少。按照方程,现将方程求出,在把 x=68 代入就能求出 y 等于多少,对于方程就是求出的预测点,下面的红色方块就是观测值,观测值和估计值之间有差异的,这个差异值叫做残差或误差项。weight=-134+4.09height 就是构造出来的紫色回归方程,紫色回归方程就能预测出更多的值,就好比做一件事,基于历史数据当中,找到变量之间的关系,因变量与自变量之间的关系,由这关系大致能把方程构建出来。对于方程来说,不可能都过每一个点,都会有偏差。假如当有一个数据,只知道体重,就用回归方程预测出大致的身高,或者体重。这就是回归方程能帮助做的事。

 

二、回归分析的一般步骤

1、 确定回归方程中的解释变量和被解释变量

2、 确定回归模型建立回归方程

3、 对回归方程进行各种检验

4、 利用回归方程进行预测

相关文章
|
机器学习/深度学习 算法 数据可视化
〖数据挖掘〗weka3.8.6的安装与使用(1)
Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费 的,非商业化软件,与之对应的是SPSS公司商业数据挖掘产品--Clementine ;weka是基于JAVA环境下开源的 机器学习(machine learning)以及数据挖掘(data mining)软件。Weka的主要开发者来自新西兰的怀卡托大学(The University of Waikato)。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的
620 0
|
存储 Java 编译器
运行第一个scala程序
运行第一个scala程序
395 10
|
Java Linux 开发工具
02. 【Android教程】开发环境搭建
02. 【Android教程】开发环境搭建
293 0
|
SQL 分布式计算 关系型数据库
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
Hadoop-24 Sqoop迁移 MySQL到Hive 与 Hive到MySQL SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
338 0
|
自然语言处理 决策智能 Python
同时操控手机和电脑,100项任务,跨系统智能体评测基准有了
【9月更文挑战第9天】近年来,随着人工智能技术的进步,自主智能体的应用日益广泛。为解决现有评测基准的局限性,研究人员推出了CRAB(Cross-environment Agent Benchmark),这是一种支持跨环境任务的新框架,结合了基于图的精细评估方法和高效的任务构建机制。CRAB框架支持多种设备并可轻松扩展至任何具备Python接口的环境。首个跨平台基准CRAB-v0包含100项任务,实验显示GPT-4单智能体在完成率方面表现最佳。CRAB框架为智能体研究提供了新机遇,但也面临计算资源和评估准确性等方面的挑战。
281 9
|
监控 安全 数据安全/隐私保护
ERP系统中的组织架构与权限管理解析
【7月更文挑战第25天】 ERP系统中的组织架构与权限管理解析
1407 2
|
运维 Java Linux
(九)JVM成神路之性能调优、GC调试、各内存区、Linux参数大全及实用小技巧
本章节主要用于补齐之前GC篇章以及JVM运行时数据区的一些JVM参数,更多的作用也可以看作是JVM的参数列表大全。对于开发者而言,能够控制JVM的部分也就只有启动参数了,同时,对于JVM的性能调优而言,JVM的参数也是基础。
337 8
|
弹性计算 Unix Linux
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1)
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1)
371 2
|
关系型数据库 网络安全 分布式数据库
如何为PolarDB数据库设置SSL加密以提高链路安全性
如何为PolarDB数据库设置SSL加密以提高链路安全性 为了保障网络安全,提高链路安全性,您可以为PolarDB数据库启用SSL(Secure Sockets Layer)加密,并安装SSL CA证书到相关的应用服务。SSL在传输层对网络连接进行加密,能提升通信数据的安全性和完整性,但可能会增加网络连接响应时间。
368 2