【Python】数据分析:pandas

简介: 【Python】数据分析:pandas

1. pandas简介

1-1 为什么要学习?

numpy已经能够帮助我们处理数据,能够结合matpolotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢?

numpy能够帮我们处理处理数值型数据,但是这还不够很多时候,数据除了数值之外,还有字符串,还有时间序列等

比如:我们通过爬虫获取到了存储在数据库中的数据比如:之前voutube的例子中除了数值之外还有国家的信息,视频的分类(tag)信息,标题信息等

所以,numpy能够帮助我们处理数值,但是pandas除了处理数值之外(基于numpy),还能够帮助我们处理其他类型的数据,如字典等

1-2 什么是pandas?

pandas is an open source, BSD-licensed library providing high-performance, easy-to-use datastructures and data analysis tools for the Python programming language.

2- pandas的常用数据类型

  1. Series 一维,带标签数组
  2. DataFrame 二维,Series容器
    {   "src": "",   "status": "error",   "percent": 0,   "align": "left",   "linkTarget": "_blank",   "display": "inline",   "message": "图片不支持拷贝复制,请单独复制上传",   "size": 0 }SE}78X03J$~I~IJ4]CY3M81.png
    image.png

    2-1 创建pandas以为数组并指定标签

import string
import pandas as pd
import numpy as np
# 自动创建索引
t1 = pd.Series([1,3,6,14,65])
print(t1)
print(type(t1))
# 通过index指定索引
t2 = pd.Series(np.arange(10),index=list(string.ascii_uppercase[0:10]))
print(t2)
# 通过字符串创建索引
t3 = pd.Series([1,3,5,2,67],index=list("abcde"))
print(t3)
# 创建对象索引
dict={
    "dream":"be a excellent person",
    "goal":"to be a knowledgable teacher in university",
    "age":21
}
t4 = pd.Series(dict)
print(t4)

84E)@A@FM1$BF1]QZL}CGK5.png

result.png

重新给其指定其他的索引之后,如果能够对应上,就取其值,如果不能,就为Nan,这个的意思就是说:个人有10种水果,你要了苹果,香蕉,菠萝,他有苹果,香蕉,但是没有菠萝,这个时候菠萝就是nan

import string
import pandas as pd
a = {string.ascii_uppercase[i]:i for i in range(10)}
print(a)
b = pd.Series(a,index=list(string.ascii_uppercase[5:15]))
print(b)

VBO~H7Y6)_[U@V[(F82XBX9.png

result.png

3. pandas的索引和切片

MS4`{B6V3G0(K]6EX3N$08Q.png

image.png

for i in b.index:
    # 获取索引的值
    print(i)
# 获取长度
print(len(b.index))

L2D8L7C86$I8M8SI@G3~9K9.png

目录
相关文章
|
10天前
|
数据挖掘 PyTorch TensorFlow
|
11天前
|
数据采集 数据挖掘 数据处理
使用Python和Pandas进行数据分析基础
使用Python和Pandas进行数据分析基础
32 5
|
1天前
|
机器学习/深度学习 数据挖掘 大数据
大数据时代的“淘金术”:Python数据分析+深度学习框架实战指南
在大数据时代,数据被视为新财富源泉,而从海量信息中提取价值成为企业竞争的核心。本文通过对比方式探讨如何运用Python数据分析与深度学习框架实现这一目标。Python凭借其强大的数据处理能力及丰富库支持,已成为数据科学家首选工具;而TensorFlow和PyTorch等深度学习框架则为复杂模型构建提供强有力的技术支撑。通过融合Python数据分析与深度学习技术,我们能在各领域中发掘数据的无限潜力。无论是商业分析还是医疗健康,掌握这些技能都将为企业和社会带来巨大价值。
16 6
|
14天前
|
数据可视化 数据挖掘 数据处理
Python中数据可视化的魔法——使用Matplotlib和Pandas
【9月更文挑战第5天】在Python的世界里,数据可视化是连接复杂数据与人类直觉的桥梁。本篇文章将带领读者探索如何使用Matplotlib和Pandas这两个强大的库来揭示数据背后的故事。我们将从基础概念开始,逐步深入到高级技巧,让每一位读者都能轻松创建引人入胜的数据可视化图表,使数据分析变得既直观又有趣。
53 14
|
8天前
|
数据采集 传感器 数据可视化
利用Python进行数据分析与可视化
【9月更文挑战第11天】在数字化时代,数据已成为企业决策和科学研究的关键。本文将引导读者了解如何使用Python这一强大的工具进行数据分析和可视化,帮助初学者理解数据处理的流程,并掌握基本的可视化技术。通过实际案例,我们将展示如何从原始数据中提取信息,进行清洗、处理,最终以图形方式展现结果,使复杂的数据变得直观易懂。
|
9天前
|
机器学习/深度学习 数据挖掘 TensorFlow
🔍揭秘Python数据分析奥秘,TensorFlow助力解锁数据背后的亿万商机
【9月更文挑战第11天】在信息爆炸的时代,数据如沉睡的宝藏,等待发掘。Python以简洁的语法和丰富的库生态成为数据分析的首选,而TensorFlow则为深度学习赋能,助你洞察数据核心,解锁商机。通过Pandas库,我们可以轻松处理结构化数据,进行统计分析和可视化;TensorFlow则能构建复杂的神经网络模型,捕捉非线性关系,提升预测准确性。两者的结合,让你在商业竞争中脱颖而出,把握市场脉搏,释放数据的无限价值。以下是使用Pandas进行简单数据分析的示例:
23 5
|
8天前
|
机器学习/深度学习 数据可视化 数据挖掘
深入浅出:使用Python进行数据分析的入门指南
【9月更文挑战第11天】本文旨在为初学者提供一条清晰的道路,通过Python探索数据科学的奇妙世界。我们将从基础语法讲起,逐步深入到数据处理、可视化以及机器学习等高级话题。文章不仅分享理论知识,还将通过实际代码示例,展示如何应用这些知识解决实际问题。无论你是编程新手,还是希望扩展技能的数据分析师,这篇文章都将是你宝贵的资源。
|
10天前
|
数据采集 数据挖掘 数据处理
使用Python和Pandas处理CSV数据
使用Python和Pandas处理CSV数据
40 5
|
8天前
|
机器学习/深度学习 数据采集 监控
Pandas与Matplotlib:Python中的动态数据可视化
Pandas与Matplotlib:Python中的动态数据可视化
|
18天前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
【9月更文挑战第2天】数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
45 5