机器学习界的「五三」:这位学者整理了一份200页的练习册,关于无监督方法、推理和学习

简介: 机器学习界的「五三」:这位学者整理了一份200页的练习册,关于无监督方法、推理和学习

我们可能都听说过一句话:「Use it or lose it」。

当我们有段时间没练习一门外语或一项运动时,就会感到生疏,从而深刻地体验到这句话的含义。练习对于保持技能很重要,对于学习新技能也是关键的因素。这就是为什么许多教科书和课程都以「练习」为特色的原因。然而,一般的练习方案往往过于简短,或者有时根本不可用。这些练习不是掌握新技能的机会,反而成为挫败感的来源。

最近,爱丁堡大学信息学院的机器学习高级讲师 Michael U. Gutmann 领衔撰写了一本 211 页的「练习册」,其中包含一系列带有详细解决方案的练习。


下载地址:https://arxiv.org/pdf/2206.13446.pdf

Michael U. Gutmann 是爱丁堡大学信息学院机器学习高级讲师,隶属于自适应与神经计算研究所。他的研究兴趣主要在于开发推理和实验设计方法,并将它们应用于自然科学中的重大问题。


作者表示:「希望详细程度足以让读者遵循解决方案并理解所使用的技术。然而,这些练习不能替代机器学习的教科书或课程。我假设读者已经看过相关的理论和概念,现在只是想通过练习加深他们的理解。」

不出所料,随便打开一页,就是满满的公式……


虽然编程和计算机模拟在机器学习中极为重要,但本书中的练习大部分可以用笔和纸来解决。此外,这本练习册可以让读者加强数学技能,但这些练习最好与计算机练习搭配来用,以进一步加深理解。

这里收集的练习主要是 Michael U. Gutmann 为赫尔辛基大学「无监督机器学习」和爱丁堡大学「概率建模与推理」课程编撰的练习的组合。这些练习并未全面涵盖所有机器学习的分支,但重点关注了无监督方法、推理和学习。Latex 源代码可在 https://github.com/michaelgutmann/ml-pen-and-paper-exercises 获得。

这确实是一本值得收藏的练习册,有人认为,这本册子和德国一些大学的研究生数学课本很接近。


有人评价其为「近期看到的最有趣的 arXiv 文章」:


整本练习册分为 10 章,分别涉及:

  • 线性代数
  • 优化
  • 定向图模型
  • 非定向图模型
  • 图模型的表现力
  • 因子图和信息传递
  • 隐马尔可夫模型的推理
  • 基于模型的学习(包括 ICA 和非标准化模型)
  • 采样和蒙特卡洛积分
  • 变分推理


完整目录如下:

相关文章
|
5月前
|
机器学习/深度学习 算法 算法框架/工具
MINUN: 微控制器上的精确机器学习推理——论文阅读
MINUN是一个专为微控制器设计的高效机器学习推理框架,能精确解决TinyML中的三大挑战:数字表示参数化、位宽分配优化和内存碎片管理。它支持如Arduino和STM32等低功耗设备,显著减少内存占用,同时保持模型精度。
498 122
|
5月前
|
机器学习/深度学习 数据采集 算法
量子机器学习入门:三种数据编码方法对比与应用
在量子机器学习中,数据编码方式决定了量子模型如何理解和处理信息。本文详解角度编码、振幅编码与基础编码三种方法,分析其原理、实现及适用场景,帮助读者选择最适合的编码策略,提升量子模型性能。
446 8
|
5月前
|
机器学习/深度学习 存储 TensorFlow
TensorFlow Lite Micro:嵌入式TinyML系统上的机器学习推理框架——论文深度解析
TensorFlow Lite Micro(TFLM)是专为嵌入式系统设计的轻量级机器学习推理框架,适用于仅有几十KB内存的微控制器。它通过极简架构、模块化设计和内存优化策略,在资源受限设备上高效运行TinyML模型,广泛应用于关键词检测、传感器分析、预测性维护等领域。TFLM支持跨平台部署,并允许硬件厂商提供定制优化,兼顾灵活性与性能。
1438 6
|
机器学习/深度学习 存储 设计模式
特征时序化建模:基于特征缓慢变化维度历史追踪的机器学习模型性能优化方法
本文探讨了数据基础设施设计中常见的一个问题:数据仓库或数据湖仓中的表格缺乏构建高性能机器学习模型所需的历史记录,导致模型性能受限。为解决这一问题,文章介绍了缓慢变化维度(SCD)技术,特别是Type II类型的应用。通过SCD,可以有效追踪维度表的历史变更,确保模型训练数据包含完整的时序信息,从而提升预测准确性。文章还从数据工程师、数据科学家和产品经理的不同视角提供了实施建议,强调历史数据追踪对提升模型性能和业务洞察的重要性,并建议采用渐进式策略逐步引入SCD设计模式。
470 8
特征时序化建模:基于特征缓慢变化维度历史追踪的机器学习模型性能优化方法
|
10月前
|
人工智能 边缘计算 前端开发
人工智能平台 PAI DistilQwen2.5-DS3-0324发布:知识蒸馏+快思考=更高效解决推理难题
DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。DistilQwen2.5-DS3-0324 系列模型是基于 DeepSeek-V3-0324 通过知识蒸馏技术并引入快思考策略构建,显著提升推理速度,使得在资源受限的设备和边缘计算场景中,模型能够高效执行复杂任务。实验显示,DistilQwen2.5-DS3-0324 系列中的模型在多个基准测试中表现突出,其32B模型效果接近参数量接近其10倍的闭源大模型。
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
1425 6
|
机器学习/深度学习 数据采集 算法
Java 大视界 -- Java 大数据机器学习模型在金融衍生品定价中的创新方法与实践(166)
本文围绕 Java 大数据机器学习模型在金融衍生品定价中的应用展开,分析定价现状与挑战,阐述技术原理与应用,结合真实案例与代码给出实操方案,助力提升金融衍生品定价的准确性与效率。
Java 大视界 -- Java 大数据机器学习模型在金融衍生品定价中的创新方法与实践(166)
|
9月前
|
缓存 并行计算 测试技术
阿里云PAI-全模态模型Qwen2.5-Omni-7B推理浅试
阿里云PAI-全模态模型Qwen2.5-Omni-7B推理浅试
2204 12
|
机器学习/深度学习 人工智能 算法
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
2308 13
机器学习算法的优化与改进:提升模型性能的策略与方法
|
机器学习/深度学习 传感器 运维
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
本文探讨了时间序列分析中数据缺失的问题,并通过实际案例展示了如何利用机器学习技术进行缺失值补充。文章构建了一个模拟的能源生产数据集,采用线性回归和决策树回归两种方法进行缺失值补充,并从统计特征、自相关性、趋势和季节性等多个维度进行了详细评估。结果显示,决策树方法在处理复杂非线性模式和保持数据局部特征方面表现更佳,而线性回归方法则适用于简单的线性趋势数据。文章最后总结了两种方法的优劣,并给出了实际应用建议。
806 7
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例