groupby 操作|学习笔记

简介: 快速学习 groupby 操作

开发者学堂课程【Python 常用数据科学库:groupby 操作】学习笔记,与课程紧密联系,让用户快速学习知识

课程地址https://developer.aliyun.com/learning/course/546/detail/7480


groupby 操作


1.定义:

在使用 python 进行数据分析的过程中,采用 groupby 函数对数据进行分组是一项很常用的操作,它可以帮助我们更清晰地了解我们所用数据的组成及规律,本节将为大家简单介绍一下如果使用 groupby 函数对数据进行分组的具体做法。

In [1]: import pandas as pd

df = pd.DataFrame({'key':['A','B','C','A','B','C','A','B','C'],

'data': [0, 5, 10, 5, 10, 15, 10, 15, 20]})

Df

image.png

//key 相当于一个标签,'A','B','C'相当于三个品牌,把 key 传进去,看看对应当前key 是不是一样的,之后把 key 回传到索引中,最后求出 sum 和。由此可以看出ABC 的累加和,是45.

In [2]: for key in ['A','B','C']:

print (key,df [df['key'] == key].sum())

image.png

image.png

先写一个函数,split 将前面的分成三块A B C ,然后 apply 进行分组算和,最后加在一起。

//用 groupby 的方法,快速简单得到和。这样在数据上做一些数据统计就比较方便,还可以指定 numpy 的操作,那样就不是 sum,而是 aggregate。总值平均值都可以求。

In [3]: df.groupby('key').sum()

image.png

In [5]:import numpy as np

df. groupby('key').aggregate (np. sum)

image.png

In [6]:import numpy as np

df.groupby('key').aggregate (np.mean)

image.png

In [7]: df = pd.read_csv(‘./data/titanic.csv')

In [8]: df. groupby ('Sex') ['Age'].mean()

image.png

//查看男性和女性的年龄

In [10]: df. groupby('Sex') ['Survived']. mean()

//统计男性女性的获救概率

//执行这样的操作非常方便,就是用格外统计数据来说,可以统计数据当中,很多个指标进行分析。

2.操作步骤:

(1)、分缩,(2)、打开,(3)、结合

相关文章
dataframe获取指定列
dataframe获取指定列
1446 0
|
机器学习/深度学习 索引 Python
技术经验分享:DataFrame(1):结构介绍
技术经验分享:DataFrame(1):结构介绍
750 0
|
存储 数据挖掘 数据处理
Pandas 数据筛选:条件过滤
Pandas 是 Python 最常用的数据分析库之一,提供了强大的数据结构和工具。本文从基础到高级,介绍如何使用 Pandas 进行条件过滤,包括单一条件、多个条件过滤、常见问题及解决方案,以及动态和复杂条件过滤的高级用法。希望本文能帮助你更好地利用 Pandas 处理数据。
837 78
|
SQL 索引 Python
Pandas中DataFrame合并的几种方法
Pandas中DataFrame合并的几种方法
2197 0
|
12月前
|
数据挖掘 数据处理 索引
Pandas数据重命名:列名与索引为标题
Pandas 是强大的数据分析工具,支持灵活的数据结构和操作。本文介绍如何使用 Pandas 对 `DataFrame` 的列名和索引进行重命名,包括直接赋值法、`rename()` 方法及索引修改。通过代码示例展示了具体操作,并讨论了常见问题如名称冲突、数据类型不匹配及 `inplace` 参数的使用。掌握这些技巧可使数据更清晰易懂,便于后续分析。
890 29
|
存储 数据挖掘 索引
Pandas数据结构:Series与DataFrame
本文介绍了 Python 的 Pandas 库中两种主要数据结构 `Series` 和 ``DataFrame`,从基础概念入手,详细讲解了它们的创建、常见问题及解决方案,包括数据缺失处理、数据类型转换、重复数据删除、数据筛选、排序、聚合和合并等操作。同时,还提供了常见报错及解决方法,帮助读者更好地理解和使用 Pandas 进行数据分析。
819 11
|
关系型数据库 MySQL
mysql 使用CTE写法
mysql 使用CTE写法
|
数据库 Python
DataFrame 与内置数据结构的相互转换
DataFrame 与内置数据结构的相互转换
232 4
|
索引 Python
如何在 Pandas 中合并数据框?
【8月更文挑战第30天】
401 4
|
数据挖掘 数据处理 Python
Pandas中的数据聚合神器:agg 方法
Pandas中的数据聚合神器:agg 方法
1109 1