Pandas之八Reshaping(一)

简介: 数据分析时,有时会要对数据做一些变形才能更好地分析,Pandas提供了灵活的方法应对该场景,包括`stack`和`pivot table`

数据分析时,有时会要对数据做一些变形才能更好地分析,Pandas提供了灵活的方法应对该场景,包括stackpivot table

  • stack:将dataframe中的列转为行。
  • pivot table:数据透视表,功能比较丰富,大多数场景都可适用。

下面使用图中两套数据对这两个功能进行说明

1. Stack

Stack提供了行转列与列转行的操作,使用.stack将列转为行,还可以使用.unstack将行转为列(stack的逆操作),返回的是SeriesDataFrame

1.1 Stack

将dataframe中指定level的列转为行,在上图数据列是单层,其列的level值既是0(类似于列表下标从0开始)也是-1(同列表下标倒数)。

  • level的默认值为-1,即将最内层的列转为行
  • 若dataframe中的列是单层,返回的是一个Series
  • 若dataframe有多层列,返回的是一个将指定level列转为行的dataframe

对示例数据做列转行操作

  1. 将最内层列(level=-1)转为行

    # 以下写法效果一致
    df8.stack()
    df8.stack(-1)
    df8.stack(1)

  1. 将weight转为行,(level=0level=-2

    df8.stack(0)
    df8.stack(-2)

  1. 将所有列都转为行,此时返回Series,同时可以看到其有多重索引

    s1=df8.stack([0,1])

1.2 unstack

unstackstack的逆操作,将DataFrame或Series中指定level的index转为列。

  • level值默认为-1,即将最内层的index转为列
  • 如果index只有一层,返回的值将是一个Series
  • 若index有多层,而未全部转为列,返回的值是一个DataFrame

对上文中的结果s1执行.unstack操作

  1. 将最内层index转为列

    # 以下语句执行效果一致
    s1.unstack()
    s1.unstack(-1)
    s1.unstack(2)

  1. 将中间层index转为列

    s1.unstack(1)
    s1.unstack(-2)

  1. 将多个index转为列

    s1.unstack([1,2])

目录
相关文章
|
SQL 索引 Python
Pandas之三选择数据
介绍在pandas中筛选数据的几种方法,快速定位某行、某列、具体元素的方法
813 0
Pandas之三选择数据
|
5月前
|
数据采集 机器学习/深度学习 数据挖掘
Pandas简易入门指南
在数据科学和数据分析的世界中,Pandas库以其强大的数据处理能力而闻名。作为一个基于Python的开源库,Pandas提供了快速、灵活和富有表现力的数据结构,旨在使数据处理变得简单和直观。无论是处理时间序列数据、统计数据分析,还是进行数据清洗和准备,Pandas都是数据科学家的首选工具之一。
58 4
|
6月前
|
数据采集 SQL 数据可视化
Python数据分析工具Pandas
【4月更文挑战第14天】Pandas是Python的数据分析库,提供Series和DataFrame数据结构,用于高效处理标记数据。它支持从多种数据源加载数据,包括CSV、Excel和SQL。功能包括数据清洗(处理缺失值、异常值)、数据操作(切片、过滤、分组)、时间序列分析及与Matplotlib等库集成进行数据可视化。其高性能底层基于NumPy,适合大型数据集处理。通过加载数据、清洗、分析和可视化,Pandas简化了数据分析流程。广泛的学习资源使其成为数据分析初学者的理想选择。
47 1
|
SQL 人工智能 JSON
你必须掌握的Python数据分析工具之Pandas
你必须掌握的Python数据分析工具之Pandas
101 0
|
机器学习/深度学习 人工智能 数据挖掘
pandas快速入门指南
Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来,享有数据分析“三剑客之一”的盛名(NumPy、Matplotlib、Pandas)。是学习数据分析、AI机器学习必学组件之一。 Pandas 这个名字来源于面板数据(Panel Data)与数据分析(data analysis)这两个名词的组合。在经济学中,Panel Data 是一个关于多维数据集的术语。Pandas 对数据的处理是为数据的分析服务的,它所提供的各种数据处理方法、工具是基于数理统计学出发,包含了日常应用中的众多数据分析方法。
118 0
pandas快速入门指南
|
数据库 开发者 索引
Pandas 基础3|学习笔记
快速学习 Pandas 基础3
Pandas 基础3|学习笔记
|
Oracle 数据挖掘 关系型数据库
python数据分析-pandas基础(1)
pandas是处理结构化(表格数据)最常用的工具,是python数据分析和数据处理的最成熟的库。pandas最早是为了处理金融数据而开发的,开放到社区至今,已经广泛应用于各个领域中;pandas以numpy为基础,而pandas是其他应用的数据基础,如Scikit-learn等。
161 0
python数据分析-pandas基础(1)
|
存储 数据采集 SQL
python数据分析-pandas学习(下)
python数据分析-pandas学习
523 0
|
SQL 数据挖掘 数据库
python数据分析-pandas学习(中)
python数据分析-pandas学习
181 0
|
存储 算法 数据挖掘
python数据分析-pandas学习(上)
python数据分析-pandas学习
2254 0
下一篇
无影云桌面