机器学习--1. 疑惑及个人见解

简介: 最近一段时间,在学习机器学习,学习过程中遇到了一些疑惑,再次记录下来,一方面梳理自己的思路,另一方面给大家分享避免踩坑,欢迎argue。。。

疑惑及个人见解

1. 《数理统计》与《概率论》

个人理解《数理统计》侧重于在样本空间上对数据进行研究,而《概率论》是在整个数据空间上研究数据特性;《数理统计》是根据局部到整体,而《概率论》直接研究整体。

2. 均值与期望

均值是《数理统计》中的含义,即研究的是样本空间上的中心点问题;期望是《概率论》上的意义,即研究的是整个数据空间上的中心点问题;因此,期望是恒定不变的,均值是沿期望波动的,而且受异常值影响较大;根据大数定理,当样本的个数趋于无穷时,均值收敛于期望,即这时,均值就是期望。

3. 独立、互斥、相关

两个事件相互独立是指两个事件发生互不影响,既可以同时发生,也可以不同时发生;互斥是指两个事件不可能同时发生,因此互斥事件一定不相互独立;相关是指两个事件发生存在依赖关系,如A的变大,B也跟着变大或变小;

4. 观察值、真实值和预测值

观察值一般指我们拿到的数据,一般是真实值的表征 ,可能存在误差,而预测值是我们根据当前数据集建立的模型的输出值。一般与真实值存在偏差,与观测值也存在偏差。

5.偏差、误差、方差,噪声

这三个最容易理解的是方差,方差表征了样本数据集围绕均值的波动情况。偏差=误差。噪声是指观察值与真实值之间的偏差,受观测方式的影响,观察值于真实值之间存在一定的偏差。

6.机器学习三要素

模型可以理解为输出函数;策略可以理解为挑选出最佳模型的方法,如损失函数+风险函数;算法可以理解为求解模型中的参数

目录
相关文章
|
6月前
|
机器学习/深度学习 数据采集 算法
Scikit-learn:打破机器学习神秘面纱,带你一路狂飙入门与进阶!
【8月更文挑战第5天】Scikit-learn 是 Python 中广泛使用的机器学习库,提供丰富的工具和算法,助力解决实际问题。对初学者友好,从简单的线性回归开始,到复杂的分类任务如逻辑回归和支持向量机,再到数据预处理如标准化和归一化,逐步展现其强大功能。通过实践,用户可以熟练掌握并应用于房价预测、图像识别等多种场景,创造高价值成果。
68 0
|
机器学习/深度学习 人工智能 算法
这篇科普让你Get所有大模型的基础核心知识点
本文介绍了AI大模型的概念和发展历程。AI大模型是指具有1亿以上参数的机器学习模型,通过在大规模数据集上进行预训练,可以直接支撑各类应用。大模型的发展经历了从萌芽期到AI1.0时期,再到AI2.0时期的飞跃,目前最新发布的大模型参数已经达到了千亿甚至万亿级别。国内外的公司都在积极研发和应用大模型,如OpenAI、Google、Facebook、Microsoft等。国内也有百度、阿里巴巴、万维、商汤科技等公司发布了自己的大模型产品。大模型的建造离不开算力资源、算法人才、数据积累等核心要素。此外,文章还列举了一些与大模型相关的专业名词,如算法、模型参数、训练数据、Token等。
|
机器学习/深度学习 数据采集 PyTorch
深度学习代码怎么读-小白阶段性思路(以手写数字识别应用为例)
深度学习代码怎么读-小白阶段性思路(以手写数字识别应用为例)
255 0
|
机器学习/深度学习 人工智能 自动驾驶
强化学习从基础到进阶--案例与实践含面试必知必答[10]:模仿学习、行为克隆、逆强化学习、第三人称视角模仿学习、序列生成和聊天机器人
强化学习从基础到进阶--案例与实践含面试必知必答[10]:模仿学习、行为克隆、逆强化学习、第三人称视角模仿学习、序列生成和聊天机器人
强化学习从基础到进阶--案例与实践含面试必知必答[10]:模仿学习、行为克隆、逆强化学习、第三人称视角模仿学习、序列生成和聊天机器人
|
机器学习/深度学习
机器学习面试重点
机器学习面试重点
183 0
|
机器学习/深度学习 人工智能
吴恩达知乎开课:谢邀,我来教你系统学习机器学习
吴恩达知乎开课:谢邀,我来教你系统学习机器学习
201 0
吴恩达知乎开课:谢邀,我来教你系统学习机器学习
|
机器学习/深度学习 算法
周志华机器学习课后习题解析【第二章】
周志华机器学习课后习题解析【第二章】
1127 0
周志华机器学习课后习题解析【第二章】
|
机器学习/深度学习 自然语言处理 算法
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
197 0
12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
|
机器学习/深度学习 人工智能 算法
当博弈论遇上机器学习:一文读懂相关理论
博弈论和机器学习能擦出怎样的火花?本文作者王子嘉通过回顾总结近年来博弈论和机器学习领域的交叉研究工作,为读者展示了这一领域最新的研究图景。
1219 0
当博弈论遇上机器学习:一文读懂相关理论
|
SQL 网络协议 算法
好教程推荐系列:收藏的C++技术面试 -- 24K纯技术干货(题目)
好教程推荐系列:收藏的C++技术面试 -- 24K纯技术干货(题目)
263 0