机器学习界的「五三」:这位学者整理了一份200页的练习册,关于无监督方法、推理和学习

简介: 机器学习界的「五三」:这位学者整理了一份200页的练习册,关于无监督方法、推理和学习

我们可能都听说过一句话:「Use it or lose it」。

当我们有段时间没练习一门外语或一项运动时,就会感到生疏,从而深刻地体验到这句话的含义。练习对于保持技能很重要,对于学习新技能也是关键的因素。这就是为什么许多教科书和课程都以「练习」为特色的原因。然而,一般的练习方案往往过于简短,或者有时根本不可用。这些练习不是掌握新技能的机会,反而成为挫败感的来源。

最近,爱丁堡大学信息学院的机器学习高级讲师 Michael U. Gutmann 领衔撰写了一本 211 页的「练习册」,其中包含一系列带有详细解决方案的练习。


下载地址:https://arxiv.org/pdf/2206.13446.pdf

Michael U. Gutmann 是爱丁堡大学信息学院机器学习高级讲师,隶属于自适应与神经计算研究所。他的研究兴趣主要在于开发推理和实验设计方法,并将它们应用于自然科学中的重大问题。


作者表示:「希望详细程度足以让读者遵循解决方案并理解所使用的技术。然而,这些练习不能替代机器学习的教科书或课程。我假设读者已经看过相关的理论和概念,现在只是想通过练习加深他们的理解。」

不出所料,随便打开一页,就是满满的公式……


虽然编程和计算机模拟在机器学习中极为重要,但本书中的练习大部分可以用笔和纸来解决。此外,这本练习册可以让读者加强数学技能,但这些练习最好与计算机练习搭配来用,以进一步加深理解。

这里收集的练习主要是 Michael U. Gutmann 为赫尔辛基大学「无监督机器学习」和爱丁堡大学「概率建模与推理」课程编撰的练习的组合。这些练习并未全面涵盖所有机器学习的分支,但重点关注了无监督方法、推理和学习。Latex 源代码可在 https://github.com/michaelgutmann/ml-pen-and-paper-exercises 获得。

这确实是一本值得收藏的练习册,有人认为,这本册子和德国一些大学的研究生数学课本很接近。


有人评价其为「近期看到的最有趣的 arXiv 文章」:


整本练习册分为 10 章,分别涉及:

  • 线性代数
  • 优化
  • 定向图模型
  • 非定向图模型
  • 图模型的表现力
  • 因子图和信息传递
  • 隐马尔可夫模型的推理
  • 基于模型的学习(包括 ICA 和非标准化模型)
  • 采样和蒙特卡洛积分
  • 变分推理


完整目录如下:

相关文章
|
11天前
|
机器学习/深度学习 Python
验证集的划分方法:确保机器学习模型泛化能力的关键
本文详细介绍了机器学习中验证集的作用及其划分方法。验证集主要用于评估模型性能和调整超参数,不同于仅用于最终评估的测试集。文中描述了几种常见的划分方法,包括简单划分、交叉验证、时间序列数据划分及分层抽样划分,并提供了Python示例代码。此外,还强调了在划分数据集时应注意随机性、数据分布和多次实验的重要性。合理划分验证集有助于更准确地评估模型性能并进行有效调优。
|
18天前
|
机器学习/深度学习 算法 搜索推荐
机器学习方法之强化学习
强化学习是一种机器学习方法,旨在通过与环境的交互来学习如何做出决策,以最大化累积的奖励。
20 4
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】机器学习、深度学习、强化学习和迁移学习简介、相互对比、区别与联系。
机器学习、深度学习、强化学习和迁移学习都是人工智能领域的子领域,它们之间有一定的联系和区别。下面分别对这四个概念进行解析,并给出相互对比、区别与联系以及应用场景案例分析。
25 1
|
1月前
|
机器学习/深度学习 人工智能 关系型数据库
【机器学习】Qwen2大模型原理、训练及推理部署实战
【机器学习】Qwen2大模型原理、训练及推理部署实战
323 0
【机器学习】Qwen2大模型原理、训练及推理部署实战
|
1月前
|
机器学习/深度学习 开发者 Python
Python 与 R 在机器学习入门中的学习曲线差异
【8月更文第6天】在机器学习领域,Python 和 R 是两种非常流行的编程语言。Python 以其简洁的语法和广泛的社区支持著称,而 R 则以其强大的统计功能和数据分析能力受到青睐。本文将探讨这两种语言在机器学习入门阶段的学习曲线差异,并通过构建一个简单的线性回归模型来比较它们的体验。
48 7
|
1月前
|
机器学习/深度学习 运维 算法
【阿里天池-医学影像报告异常检测】3 机器学习模型训练及集成学习Baseline开源
本文介绍了一个基于XGBoost、LightGBM和逻辑回归的集成学习模型,用于医学影像报告异常检测任务,并公开了达到0.83+准确率的基线代码。
38 9
|
21天前
|
开发者 算法 虚拟化
惊爆!Uno Platform 调试与性能分析终极攻略,从工具运用到代码优化,带你攻克开发难题成就完美应用
【8月更文挑战第31天】在 Uno Platform 中,调试可通过 Visual Studio 设置断点和逐步执行代码实现,同时浏览器开发者工具有助于 Web 版本调试。性能分析则利用 Visual Studio 的性能分析器检查 CPU 和内存使用情况,还可通过记录时间戳进行简单分析。优化性能涉及代码逻辑优化、资源管理和用户界面简化,综合利用平台提供的工具和技术,确保应用高效稳定运行。
32 0
|
21天前
|
机器学习/深度学习 TensorFlow 算法框架/工具
全面解析TensorFlow Lite:从模型转换到Android应用集成,教你如何在移动设备上轻松部署轻量级机器学习模型,实现高效本地推理
【8月更文挑战第31天】本文通过技术综述介绍了如何使用TensorFlow Lite将机器学习模型部署至移动设备。从创建、训练模型开始,详细演示了模型向TensorFlow Lite格式的转换过程,并指导如何在Android应用中集成该模型以实现预测功能,突显了TensorFlow Lite在资源受限环境中的优势及灵活性。
49 0
|
2月前
|
异构计算 索引
单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速
【7月更文挑战第24天】针对大语言模型(LLM)处理长上下文时的计算瓶颈,微软推出MInference,基于动态稀疏注意力加速预填充,使8B参数模型处理1M token从30分钟降至3分钟,推理延迟降低10倍。通过识别注意力矩阵模式(A形、斜线、块稀疏),仅计算关键权重,无需修改预训练或微调。实验证明,MInference在多个任务和模型上保持准确度,但可能不适用所有LLM类型,存在轻微性能损失风险。
96 17
|
1月前
|
机器学习/深度学习 算法 Python
【机器学习】面试问答:决策树如何进行剪枝?剪枝的方法有哪些?
文章讨论了决策树的剪枝技术,包括预剪枝和后剪枝的概念、方法以及各自的优缺点。
45 2

热门文章

最新文章