【Python数据分析 - 9】:DataFrame结构中自定义行列索引(Pandas篇)

简介: 【Python数据分析 - 9】:DataFrame结构中自定义行列索引(Pandas篇)

pandas设置行列索引


本次以股票的数据为例


数据准备&DataFrame结构



  • 模块导入
import pandas as pd
import numpy as np



  • numpy准备数据
stock = np.random.normal(0, 1, [500, 504])




  • 使用pd.DataFrame(),将数据变为DataFrame结构


  • 生成的DataFrame中默认的行列索引为数字

2bba4bc13fe74093a915add17d4dfc2c.png

5e15a5c12cb64fe386e9eec25bac867c.png


自定义行索引


  • 准备行索引数据

a15e1036651f4021bc510454e7e211c1.png


设置行索引,在将数据变为DataFrame结构时添加:index=stock_index

625da87cd9ab4b30bad0737b4d87afbd.png

结果展示9402eaab2d934145a945f2a252f41232.png


自定义列索引


pandas中时间序列 - date_range函数


函数功能:生成一个固定频率的时间索引,使用此函数时,须指定start,end或periods,否则报错。


语法:pandas.date_range(start=None, end=None, periods=None, freq=‘D’, tz=None, normalize=False, name=None, closed=None, **kwargs)


主要参数说明:


   periods:固定时期,取值为整数或None,设置为整数时会从根据start的时期往后取到periods天。


   freq:日期偏移量,取值为string或DateOffset,默认为’D’;当设置为’B‘时表示除去周六和周日。


   normalize:若参数为True表示将start、end参数值正则化到午夜时间戳。


   name:生成时间索引对象的名称,取值为string或None。


   closed:当closed=‘left’ 表示在返回的结果基础上,再取左开右闭的结果;当closed='right’表示在返回的结果基础上,再取左闭右开的结果。



列索引设置


  • 准备列索引数据

6d63a6b94c2d40499a41d22129e42a38.png


列索引数据展示

3a5e168e9f9f45039975b6edc1712e43.png


设置列索引,在将数据变为DataFrame结构时添加:columns=date

18a1a0c8f8ee4aa4b171deab6eab5140.png

结果展示


b6c35876d2f042bda30bf2dad02d48ca.png


相关文章
|
7月前
|
Java 数据处理 索引
(Pandas)Python做数据处理必选框架之一!(二):附带案例分析;刨析DataFrame结构和其属性;学会访问具体元素;判断元素是否存在;元素求和、求标准值、方差、去重、删除、排序...
DataFrame结构 每一列都属于Series类型,不同列之间数据类型可以不一样,但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列,该列记录了每一行的索引 在DataFrame中,若列之间的元素个数不匹配,且使用Series填充时,在DataFrame里空值会显示为NaN;当列之间元素个数不匹配,并且不使用Series填充,会报错。在指定了index 属性显示情况下,会按照index的位置进行排序,默认是 [0,1,2,3,...] 从0索引开始正序排序行。
551 0
|
8月前
|
数据采集 数据可视化 数据挖掘
Python数据分析实战:Pandas处理结构化数据的核心技巧
在数据驱动时代,结构化数据是分析决策的基础。Python的Pandas库凭借其高效的数据结构和丰富的功能,成为处理结构化数据的利器。本文通过真实场景和代码示例,讲解Pandas的核心操作,包括数据加载、清洗、转换、分析与性能优化,帮助你从数据中提取有价值的洞察,提升数据处理效率。
420 3
|
10月前
|
自然语言处理 数据挖掘 数据处理
告别低效代码:用对这10个Pandas方法让数据分析效率翻倍
本文将介绍 10 个在数据处理中至关重要的 Pandas 技术模式。这些模式能够显著减少调试时间,提升代码的可维护性,并构建更加清晰的数据处理流水线。
336 3
告别低效代码:用对这10个Pandas方法让数据分析效率翻倍
|
10月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
1158 0
|
数据采集 数据可视化 数据挖掘
Pandas数据应用:天气数据分析
本文介绍如何使用 Pandas 进行天气数据分析。Pandas 是一个强大的 Python 数据处理库,适合处理表格型数据。文章涵盖加载天气数据、处理缺失值、转换数据类型、时间序列分析(如滚动平均和重采样)等内容,并解决常见报错如 SettingWithCopyWarning、KeyError 和 TypeError。通过这些方法,帮助用户更好地进行气候趋势预测和决策。
475 71
|
7月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
8月前
|
数据可视化 数据挖掘 大数据
基于python大数据的水文数据分析可视化系统
本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。
|
9月前
|
存储 数据挖掘 大数据
基于python大数据的用户行为数据分析系统
本系统基于Python大数据技术,深入研究用户行为数据分析,结合Pandas、NumPy等工具提升数据处理效率,利用B/S架构与MySQL数据库实现高效存储与访问。研究涵盖技术背景、学术与商业意义、国内外研究现状及PyCharm、Python语言等关键技术,助力企业精准营销与产品优化,具有广泛的应用前景与社会价值。
|
12月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据分析,别再死磕Excel了!
Python数据分析,别再死磕Excel了!
482 2

推荐镜像

更多