【python】python中随机打乱数据集

简介: python中随机打乱数据集

假设我们现在有数据:data,label

import numpy as np
data = np.array([[1,2],[4,5],[3,6],[7,8]])
label = np.array([1,0,1,1])

在这里插入图片描述在这里插入图片描述

方法一:

 # 打乱数据顺序
 import random
 index = [i for i in range(len(data))]
 random.shuffle(index)
 data = data[index]
 label = label[index]

打乱后的结果:
在这里插入图片描述在这里插入图片描述
方法二:

    data_size = data.shape[0] # 数据集个数
    arr = np.arange(data_size) # 生成0到datasize个数
    np.random.shuffle(arr) # 随机打乱arr数组
    data = data[arr] # 将data以arr索引重新组合
    label = label[arr] # 将label以arr索引重新组合

当然还有其他的方法,这里提到的仅做参考。
在我的项目中可以实际体验:
https://blog.csdn.net/AugustMe/article/details/94166164

相关文章
|
2月前
|
数据采集 Python
Python实用记录(七):通过retinaface对CASIA-WebFace人脸数据集进行清洗,并把错误图路径放入txt文档
使用RetinaFace模型对CASIA-WebFace人脸数据集进行清洗,并将无法检测到人脸的图片路径记录到txt文档中。
43 1
|
4月前
|
机器学习/深度学习 数据采集 数据可视化
【python】python当当数据分析可视化聚类支持向量机预测(源码+数据集+论文)【独一无二】
【python】python当当数据分析可视化聚类支持向量机预测(源码+数据集+论文)【独一无二】
|
29天前
|
机器学习/深度学习 算法 PyTorch
用Python实现简单机器学习模型:以鸢尾花数据集为例
用Python实现简单机器学习模型:以鸢尾花数据集为例
77 1
|
2月前
|
数据可视化 数据挖掘 大数据
Python 数据分析入门:从零开始处理数据集
Python 数据分析入门:从零开始处理数据集
|
4月前
|
数据可视化 数据挖掘 索引
【python】Python马铃薯批发市场交易价格数据分析可视化(源码+数据集)【独一无二】
【python】Python马铃薯批发市场交易价格数据分析可视化(源码+数据集)【独一无二】
113 0
|
4月前
|
数据采集 数据可视化 Python
【python】python猫眼电影数据抓取分析可视化(源码+数据集+论文)【独一无二】
【python】python猫眼电影数据抓取分析可视化(源码+数据集+论文)【独一无二】
216 1
|
4月前
|
数据采集 机器学习/深度学习 算法
【python】python客户信息审计风险决策树算法分类预测(源码+数据集+论文)【独一无二】
【python】python客户信息审计风险决策树算法分类预测(源码+数据集+论文)【独一无二】
|
4月前
|
机器学习/深度学习 数据采集 数据可视化
【python】python母婴数据分析模型预测可视化(数据集+论文+PPT+源码)【独一无二】
【python】python母婴数据分析模型预测可视化(数据集+论文+PPT+源码)【独一无二】
|
4月前
|
数据采集 数据可视化 数据挖掘
【python 】python 年度人口结构数据分析与可视化(源码+数据集)【独一无二】
【python 】python 年度人口结构数据分析与可视化(源码+数据集)【独一无二】
|
4月前
|
存储 数据可视化 数据挖掘
【python】python企业财务能力数据分析可视化(源码+报告+数据集)【独一无二】
【python】python企业财务能力数据分析可视化(源码+报告+数据集)【独一无二】
206 1