需求分析(上)| 学习笔记

简介: 快速学习需求分析(上)

开发者学堂课程【机器学习实战:需求分析(上)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/530/detail/7129


需求分析(上)

如何进行场景分析

(一)场景分析,对场景进行分析,针对既定目标,抽象成一个可由机器学习等解决的的技术问题。

换言之,需要提出一个可由已知数据回答的问题。

(二)分析方法

1、首先分析场景里是否有确定的结果字段,然后判断收集的数据集里是否包含结果字段,若包含则为有监督学习,没包含为无监督学习,若只有一般结果即为半监督学习。

2、有监督学习,若为联系的数值即为回归问题,若为离散型数值则为分类问题。

无监督学习中,若希望返回的是发现群组,为聚类问题;若是让发现项与项间的关系,即为关联性问题;

若是希望用更少的数据特征描述整个数据,则为数据降维问题可以考虑 PCA。半监督学习比较复杂。

3、集成学习、增强学习、深度学习相当于算法增强,可适应更复杂的场景解决更复杂问题。

image.png

(三)生存预测(以泰坦尼克生存预测做分析)

1、首先确定场景中有无结果字段,如图发现有

image.png

2、确定训练数据中有无 survived 字段,如图可见有,所以认为包含结果字段

image.png

3、因为为包含结果字段,所以认定为有监督学习

image.png

4、如同可看到取值为 0 1,所以认定为离散的两分类问题,应采取合适的算法。至于是否需要算法增强要根据实际判断

image.png

(四)更多案例

image.png

相关文章
|
编解码 数据安全/隐私保护
平面设计师资格证怎么考
平面设计(graphic design),也称为视觉传达设计,是以“视觉”作为沟通和表现的方式,透过多种方式来创造和结合符号、图片和文字,借此作出用来传达想法或讯息的视觉表现。
平面设计师资格证怎么考
|
Unix Linux iOS开发
ping命令常用参数以及traceout命令
`ping`和 `traceroute`/`tracert`是网络诊断中的两个基本工具,了解它们的常用参数和使用方法对于进行网络问题的排查和性能分析至关重要。通过熟练使用这些基础命令,您可以快速识别和解决网络连接问题,保证网络的稳定性和可靠性。
242 2
|
机器学习/深度学习 数据采集 监控
探索机器学习中的数据偏见及其影响
在机器学习领域,数据偏见是一个日益受到关注的问题。本文通过分析数据偏见的来源、表现和对模型性能的影响,旨在揭示如何识别和减少这种偏见。文章首先定义了数据偏见并探讨了其产生的原因,接着通过案例分析了偏见对模型决策的具体影响,最后提出了几种减轻数据偏见的策略。研究指出,虽然完全消除数据偏见是极其困难的,但通过合理的数据处理和算法设计可以显著降低其负面影响。
textarea文本框根据输入内容自动适应高度
textarea文本框根据输入内容自动适应高度
437 0
|
3天前
|
数据采集 人工智能 安全
|
12天前
|
云安全 监控 安全
|
4天前
|
自然语言处理 API
万相 Wan2.6 全新升级发布!人人都能当导演的时代来了
通义万相2.6全新升级,支持文生图、图生视频、文生视频,打造电影级创作体验。智能分镜、角色扮演、音画同步,让创意一键成片,大众也能轻松制作高质量短视频。
1041 151