低门槛实战线性回归模型

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 本文是学习线性回归模型的总结,以图文相结合的方式,分享线性回归模型的技术原理,以及用代码实现验证,供大家参考。

本文是学习线性回归模型的总结,主要分享线性回归模型的技术原理,以及用代码实现验证,供大家参考。

一、任务描述

假设手上有一份数据集,每一行数据表示一个物品的价格影响因素(k个)和对应价格。

序号

影响因素1

影响因素2

影响因素k

价格(y)

1

1.23

3.23

1.56

7.23

2

0.23

1.60

2.56

8.33

...

...

...

...

...

1000

xx

xx

xx

xx

现在获得了该物品的k个影响因素,要求根据k个影响因素求取该物品的价格。

二、任务分析

1、目标

image.png

那么我们的任务就是寻找一组参数W和b,使得根据线性回归模型做出的价格预测尽可能接近数据里的真实价格。

2、评估

如何评估找到的一组参数W和b,就是使得根据线性回归模型做出的价格预测尽可能接近数据里的真实价格。

在深度学习中,损失函数(loss function)能够量化目标的实际值与预测值之间的差距。回归问题中最常用的损失函数是平方误差函数,那么第i个样本的损失为:

image.png

因此,在训练模型时,我们希望寻找一组参数(W,b),使得L(Wb在所有训练样本上的损失均值越小越好。

3、求解

在深度学习中,求解参数(W,b),一般用梯度下降法。梯度下降算法的步骤如下:

(1)初始化模型参数的值;(2)从数据集中随机抽取小批量样本且在负梯度的方向上更新参数,并不断迭代这一步骤,直到迭代次数达到设定阈值或损失小于某个阈值。

W和b的更新表达式如下:

image.png

批量大小和学习率的值通常是预先指定,而不是通过模型训练得到的这些可以调整但不在训练过程中更新的参数称为超参数(hyperparameter),所谓的调参就是选择超参数的过程。

三、代码验证

整个代码验证过程包括如下主要流程:

image.png

1、获取训练数据

为验证线性回归模型,我们定义一个线性函数,生成一个数据集。

image.png

为从n个样本数据中抽取小批量数据,定义个批量数据迭代器

image.png

2、定义模型

image.png

根据上述表达式定义线性回归模型。

image.png

3、定义损失函数

image.png

根据上述表达式定义损失函数。

image.png

4、定义优化算法

image.png

根据上述表达式定义优化算法。

image.png

5、初始化训练参数

首先初始化模型参数。

image.png

6、训练

image.png

训练结束后,可以查看W和b的参数,以及与真实值W和b的差异

image.png

运行结果

image.png

参考资料

1、《动手学深度学习》第二版,地址: zh.d2l.ai/index.html

目录
相关文章
|
4月前
|
机器学习/深度学习 算法 Python
CatBoost中级教程:集成学习与模型融合
CatBoost中级教程:集成学习与模型融合【2月更文挑战第13天】
106 3
|
22天前
|
机器学习/深度学习
机器学习回归模型相关重要知识点总结
机器学习回归模型相关重要知识点总结
|
3月前
|
机器学习/深度学习 数据采集 资源调度
【机器学习】逻辑回归:原理、应用与实践
逻辑回归(Logistic Regression)是一种广泛应用于分类问题的统计学方法,尽管其名称中含有“回归”二字,但它实际上是一种用于解决二分类或多分类问题的线性模型。逻辑回归通过使用逻辑函数(通常为sigmoid函数)将线性模型的输出映射到概率空间,从而预测某个事件发生的概率。本文将深入探讨逻辑回归的理论基础、模型构建、损失函数、优化算法以及实际应用案例,并简要介绍其在机器学习领域的地位和局限性。
339 2
|
3月前
|
算法 计算机视觉 Python
技术经验分享:GBM模型调参详解
技术经验分享:GBM模型调参详解
|
3月前
|
机器学习/深度学习 算法
技术经验解读:【机器学习】代价函数(costfunction)
技术经验解读:【机器学习】代价函数(costfunction)
|
4月前
|
机器学习/深度学习 算法 数据可视化
如何选择正确的机器学习模型?
【5月更文挑战第4天】如何选择正确的机器学习模型?
80 4
|
4月前
|
机器学习/深度学习
机器学习基础入门(二)(线性回归与成本函数)
已知一系列房子的大小以及其对应的价格的数据,要求是已知房子大小预测其房子的价格
|
4月前
|
机器学习/深度学习 存储 分布式计算
在阿里云上训练机器学习模型:逻辑回归和GBDT实践指南
机器学习在当今数据驱动的世界中扮演着关键角色,为业务决策提供了强大的支持。本文将详细介绍如何在阿里云上使用相关产品,训练逻辑回归(Logistic Regression)和梯度提升决策树(Gradient Boosted Decision Trees,GBDT)模型。我们将使用MaxCompute、PAI(机器学习平台)、DataWorks等阿里云产品,通过代码示例和详细说明,带你一步步完成整个流程。
178 0
|
机器学习/深度学习 算法
入坑机器学习:六,逻辑回归
在分类问题中,你要预测的变量 𝑦 是离散的值,我们将学习一种叫做逻辑回归 (Logistic Regression ) 的算法,这是目前最流行使用最广泛的一种学习算法。
141 0
入坑机器学习:六,逻辑回归
|
机器学习/深度学习 分布式计算 并行计算
十七、大规模机器学习和随机梯度下降(SGD)
十七、大规模机器学习和随机梯度下降(SGD)
十七、大规模机器学习和随机梯度下降(SGD)