机器学习:sklearn数据集简介

简介: 机器学习:sklearn数据集简介

算法分类

监督学习 特征值 + 目标值
    -分类 目标值是离散数据
    -回归 目标值是连续数据
无监督学习  只有特征值
    -聚类

数据集

数据

-训练集 80% 70% 75%

-测试集 20% 30% 25%

数据拆分:

sklearn.model_selection.train_test_split

sklearn数据集

sklearn.datasets
  -小规模数据集
      -datasets.load_*()
      -已下载
  -大规模数据集
      -datasets.fetch_*()
      - 需要下载默认目录:~/scikit_learn_data/

数据类型

datasets.base.Bunch(字典格式)
    data:特征数据 二维数组[n_samples * n_features]
    target: 标签数组
    DESCR: 数据描述
    feature_names:特征名(新闻数据,手写数字,回归数据集没有)
    target_names:标签名

数据集介绍

分类数据集
    鸢尾花数据集 sklearn.datasets.load_iris
    新闻数据集 sklearn.datasets.fetch_20newsgroups
回归数据集
    波士顿房价数据集 sklearn.datasets.load_boston
    糖尿病数据集 sklearn.datasets.load_diabetes


相关文章
|
监控 安全 调度
彻底解决5大开源痛点,阿里云发布任务调度 XXL-JOB 版
阿里云任务调度XXL-JOB版 迎来重磅发布,以任务调度SchedulerX为内核,0代码改造,完全兼容开源XXL-JOB客户端接入,解决开源XXL-JOB痛点问题。
1629 113
|
负载均衡 Java API
Java一分钟之-Spring Cloud OpenFeign:声明式服务调用
【6月更文挑战第9天】Spring Cloud OpenFeign是声明式服务调用库,简化了微服务间调用。通过动态代理,它允许开发者用Java接口调用HTTP服务,支持服务发现、负载均衡。本文介绍了OpenFeign的基本概念,展示了如何添加依赖、开启客户端和定义服务接口。还讨论了接口调用失败、超时重试和日志配置等问题及其解决方案,并提供了自定义Feign配置的代码示例。通过学习,读者可以更好地在微服务架构中使用OpenFeign进行服务通信。
669 4
|
3天前
|
数据采集 人工智能 安全
|
12天前
|
云安全 监控 安全
|
4天前
|
自然语言处理 API
万相 Wan2.6 全新升级发布!人人都能当导演的时代来了
通义万相2.6全新升级,支持文生图、图生视频、文生视频,打造电影级创作体验。智能分镜、角色扮演、音画同步,让创意一键成片,大众也能轻松制作高质量短视频。
1069 151
|
4天前
|
编解码 人工智能 机器人
通义万相2.6,模型使用指南
智能分镜 | 多镜头叙事 | 支持15秒视频生成 | 高品质声音生成 | 多人稳定对话
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
1743 9
|
9天前
|
人工智能 自然语言处理 API
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸
一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。
687 152
|
11天前
|
人工智能 安全 前端开发
AgentScope Java v1.0 发布,让 Java 开发者轻松构建企业级 Agentic 应用
AgentScope 重磅发布 Java 版本,拥抱企业开发主流技术栈。
655 12