总结与回顾 | 学习笔记

简介: 快速学习总结与回顾

开发者学堂课程【机器学习实战:总结与回顾】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/530/detail/7136


总结与回顾

内容介绍

一、 课程回顾

二、 学习目标

三、 思考与练习

 

一、课程回顾

机械流程学习完成了,接下来课程回顾,内容有:

1、机器学习的整体流程

2、如何进行需求分析,包括数据探索、场景分析等

3、介绍数据预处理,包括清洗、集成、变换、规约等

4、特征工程,包括特征的产生、变换、评估、选择等

5、使用数据集训练模型及对模型结果进行评估

6、模型的部署和应用

第 1 点介绍了机器学习的整体流程,这种方法论的东西对输出一个质量稳定的项目来说是非常重要的。依据方法论的东西不能保证项目做的有多好,但是肯定可以保证项目质量是在水准之上的,不会偏差太多。

第 2 点介绍了如何进行需求分析,要了解数据的状况,包括数据探索和场景分析等。要进行人物场景分析,将任务的东西用数据表示出来。

第 3 点介绍了数据预处理,该部分的工作量比较大,包括清洗,集成,评估,规约等。

第 4 点介绍了特征工程,介绍了特征工程在整个机器学习过程中非常重要。因为算法可能相同,数据也可能相同,但是最后结果相差比较大,因为有的利用特征工程创建了优质的特征从而导致最后结果比较好。特征工程的内容其实很复杂,因为本课程只是入门的课程,所以关于特征工程的内容只是进行了简单介绍。

第 5 点是如何使用数据集训练模型以及如何对模型结果进行评估。重点介绍了分裂模型等,包括一些常用的数据指标,实际上对于分类,对于聚类和回归都有不同的评判方法,本课程重点介绍了分类,大家也可能花时间了解一下分裂和回归。

第 6 点介绍了模型的部署和应用,如何根据需求把应用嵌入到业务流中。并且模型不是一劳永逸的,需要根据业务数据的变化和输出结果的优异进行定期的模型更新,也就是周期管理。

 

二、学习目标

1、了解机器学习的整体流程

2、能根据实际场景进行需求分析:能确定问题是什么,需要哪些数据,需要哪些算法

3、掌握基本的数据预处理的方法

4、能进行模型训练和结果评估:如何根据数据集进行模型训练,模型产出后能根据各种技术手段,技术指标进行评估。能比较不同结果之间的优劣

5、能合理部署及应用模型

 

三、思考与练习

1、了解机器学习的完整流程,以 Titanic 数据集为例,简述思路。

2、基于第一章中介绍的例子,进行需求分析。

3、找一些周知数据集,进行数据探查,发掘数据的特点。

4、找一些周知数据集,尝试从多个维度扩展特征,越多越好。并使用介绍的评估技术,对新特征进行评估,筛选出重要特征。

5、掌握两分类模型的评估方法,基于两分类数据集,使用编程语言或者其他工具( Excel )等,生成混淆矩阵,并绘制 ROC 曲线。也可以编个小程序来进行,增进对细节的理解。

6、描述分类模型、聚类模型应用流程的区别。进行数据时,对于分类的项目和数据的项目要有一个区别。

7、了解在线模型应用和离线模型应用的区别,试结合几个例子进行说明。

相关文章
|
4月前
|
JSON 算法 安全
淘宝商品详情API接口系列,json数据返回
淘宝开放平台提供了多种API接口用于获取商品详情信息,主要通过 淘宝开放平台(Taobao Open Platform, TOP) 的 taobao.tbk.item.info.get(淘宝客商品详情)或 taobao.item.get(标准商品API)等接口实现。以下是关键信息及JSON返回示例:
|
9月前
|
资源调度 监控 调度
基于SCA的软件无线电系统的概念与架构
软件通信体系架构(SCA)是基于软件定义无线电(SDR)思想构建的开放式、标准化和模块化平台,旨在通过软件实现通信功能的灵活配置。SCA起源于美军为解决“信息烟囱”问题而推出的联合战术无线电系统(JTRS),其核心目标是提升多军种联合作战通信能力。 上海介方信息公司的OpenSCA操作环境严格遵循SCA4.1/SRTF标准,支持高集成、嵌入式等场景,适用于军用通信、雷达等领域。 SCA体系包括目标平台资源层(TRL)、环境抽象层(EAL)、SRTF操作环境(OE)及应用层(AL)。其中,SRTF操作环境包含操作系统、运行时环境(RTE)和核心框架(CF),提供波形管理、资源调度等功能。
|
6月前
|
安全 量子技术 数据安全/隐私保护
量子密钥分发:下一代信息安全基石
量子密钥分发:下一代信息安全基石
355 72
|
11月前
|
安全 网络协议 Linux
结合 `nc` 工具利用笑脸漏洞(Smile Bug)攻击 Metasploitable2 Linux
本文介绍如何使用 `nc`(Netcat)工具结合笑脸漏洞(Smiley Bug)攻击 Metasploitable2 Linux 靶机。首先概述了 `nc` 的基本功能和高级用法,包括建立连接、监听端口、文件传输等操作。接着详细描述了笑脸漏洞的原理及其在网络攻防中的应用,展示了通过 `nc` 发送恶意输入检测漏洞的方法。最后结合 Python 脚本实现更复杂的攻击场景,并强调了合法性和环境隔离的重要性。
436 13
|
11月前
|
人工智能 算法 搜索推荐
《开源算法:人工智能领域的双刃剑》
在人工智能蓬勃发展的今天,开源算法作为重要支撑,显著促进了算法创新、模型开发、技术进步与知识共享,并节省了时间与计算资源,降低了企业开发成本。然而,它也存在数据隐私与安全、个性化服务、创新速度、技术支持与维护及许可证与法律等方面的局限性。实际应用中需权衡优劣,选择合适方案以实现最大价值。
380 10
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
《预训练语言模型:开启智能时代的大门》
预训练语言模型如BERT和GPT是当今AI领域的核心技术,广泛应用于自然语言处理。训练过程包括数据准备、模型架构(如Transformer)、掩码语言模型和下一句预测等方法。应用场景涵盖文本分类、情感分析、问答系统和语言生成等。BERT擅长理解任务,GPT则在生成任务中表现优异。未来,预训练模型将继续优化并拓展应用领域。
234 9
|
弹性计算 安全 数据库
阿里云2024年优惠政策合集_你要的优惠都在这!
阿里云2024年优惠政策合集_你要的优惠都在这!
597 0
|
JSON C# 数据格式
KiCad 与其他 EDA 转换
KiCad 与其他 EDA 文件转换。
2216 0
KiCad 与其他 EDA 转换
|
前端开发 Java API
Jetpack Compose 动画实战:高仿微博长按点赞彩虹
基于 Jetpack Compose 提供的 Animtable 等动画 API 实现高仿微博长按点赞彩虹动画的效果,
634 0
Jetpack Compose 动画实战:高仿微博长按点赞彩虹