数据分析时,有时会要对数据做一些变形才能更好地分析,Pandas提供了灵活的方法应对该场景,包括stack
和pivot table
。
stack
:将dataframe中的列转为行。pivot table
:数据透视表,功能比较丰富,大多数场景都可适用。
下面使用图中两套数据对这两个功能进行说明
1. Stack
Stack
提供了行转列与列转行的操作,使用.stack
将列转为行,还可以使用.unstack
将行转为列(stack
的逆操作),返回的是Series
或DataFrame
。
1.1 Stack
将dataframe中指定level
的列转为行,在上图数据列是单层,其列的level值既是0
(类似于列表下标从0开始)也是-1
(同列表下标倒数)。
level
的默认值为-1,即将最内层的列转为行- 若dataframe中的列是单层,返回的是一个Series
- 若dataframe有多层列,返回的是一个将指定level列转为行的dataframe
对示例数据做列转行操作
将最内层列(
level=-1
)转为行# 以下写法效果一致 df8.stack() df8.stack(-1) df8.stack(1)
将weight转为行,(
level=0
或level=-2
)df8.stack(0) df8.stack(-2)
将所有列都转为行,此时返回Series,同时可以看到其有多重索引
s1=df8.stack([0,1])
1.2 unstack
unstack
是stack
的逆操作,将DataFrame或Series中指定level
的index转为列。
level
值默认为-1,即将最内层的index转为列- 如果index只有一层,返回的值将是一个Series
- 若index有多层,而未全部转为列,返回的值是一个DataFrame
对上文中的结果s1
执行.unstack
操作
将最内层index转为列
# 以下语句执行效果一致 s1.unstack() s1.unstack(-1) s1.unstack(2)
将中间层index转为列
s1.unstack(1) s1.unstack(-2)
将多个index转为列
s1.unstack([1,2])