Python数据可视化--Matplotlib--入门

简介: Python数据可视化--Matplotlib--入门

Matplotlib介绍

1. Matplotlib 是 Python 中常用的 2D 绘图库,它能轻松地将数据进行可视化,作出精美的图表。


2. Matplotlib 这个模块很庞大,最常用的是其中一个子模块——pyplot 。


import matplotlib.pyplot as plt

pyplot模块

1. pyplot 中最基础的作图方式是以点作图,即给出每个点的坐标,pyplot 会将这些点在坐标系中画出,并用线将这些点连起来。

import numpy as np
import matplotlib.pyplot as plt
 
x=np.arange(0,2*np.pi,0.1) 
# 生成一个从 0 到 2π 的数组,步长是 0.1。
y=np.sin(x) 
# numpy 中计算正弦函数的方法,我们将 x 的值传进去就得到对应的正弦值。
plt.plot(x,y) 
#有了 x 和 y 的值之后,将其分别传入 plt.plot() 方法,pyplot 会将其转换成对应的坐标。
plt.show()
# 将这些坐标连成线就得到了函数的图像,最后调用 plt.show() 方法就能将图像显示出来了。

2. 其实对于每一对 x 和 y,还有一个可选的格式化参数,用来指定线条的颜色、点标记和线条的类型。

import numpy as np
import matplotlib.pyplot as plt
# 设置字体为黑体,防止报错
plt.rcParams['font.family'] = ['SimHei']
# 生成对应数组
x = np.arange(0, 2 * np.pi, 0.1)
y1 = np.sin(x)
y2 = np.cos(x)
# 生成对应函数
plt.plot(x, y1, 'ro--')  # 正弦函数图像
plt.plot(x, y2, 'b*-.')  # 余弦函数图像
# 等价于 plt.plot(x, y1, 'ro--', x, y2, 'b*-.')
plt.show()

呈现图分类

1. 按照数据展示的目标可以把它们分为五种,分别是:趋势、比较、构成、分布和联系。


2. 趋势:这是最常见的一种时间序列关系,关心数据如何随着时间变化,趋势类里的图表能直观反映出每年、每月、每天的变化趋势,增长、减少、上下波动还是基本不变。最常见的是折线图,它能很好地表现指标随时间呈现的趋势。


3. 构成:主要关注每个部分占整体的比例。展示构成关系的图表类型里,最常见的就是饼壮图。


4. 比较:可以展示某个维度上的排列顺序,分析某维度之间的对比是差不多,还是 “大于”、“小于”,


5. 分布:当你关心数据集中、频率、分布时,比如根据地理位置数据,通过地图来展示不同分布特征。比较常用的图表有地图、直方图、散点图。


6. 联系:主要查看两个变量之间是否表达出我们预期所要证明的相关关系。


绘制折线图

1. plt.rcParams['font.family'] = ['SimHei'],再绘图之前先把字体设置成黑体,防止报错。


2. 加图例很简单,只要在调用 plt.plot() 方法时传入 lable 参数,接着用 plt.legend() 方法显示图例即可。

import matplotlib.pyplot as plt
 
x = ['周一', '周二', '周三', '周四', '周五', '周六', '周日']
y1 = [61, 42, 52, 72, 86, 91, 73]
y2 = [23, 26, 67, 38, 46, 55, 33]
# 修改字体
plt.rcParams['font.family'] = ['SimHei']
# 传入 label 参数
plt.plot(x, y1, label='商品 A')
plt.plot(x, y2, label='商品 B')
# 显示图例
plt.legend()
# 绘制图片
plt.show()


1. 如果想自行选择图例位置的话可以通过 plt.legend() 方法的 loc 参数实现。


2. 我们还可以通过 plt.xlable() 和 plt.ylable() 方法来设置 x 轴和 y 轴的标签.


3. 还能通过 plt.title() 给图表设置标题。


plt.legend(loc='lower right')
# 设置 x 轴标签
plt.xlabel('时间')
# 设置 y 轴标签
plt.ylabel('销量')
# 设置图表标题
plt.title('商品销量对比图')

绘制柱状图

普通柱状图

1. 调用 plt.bar() 方法即可,我们需要传入两个参数。


2. 第一个参数是 x 轴上刻度的标签序列。


3. 第二个参数则用于指定每个柱子的高度,也就是具体的数据。


4.  plt.bar() 还有一些可选参数,常用的有 width 和 color,分别用于设置柱子的宽度和颜色。

import matplotlib.pyplot as plt
plt.rcParams['font.family'] = ['SimHei']
names = ['篮球', '羽毛球', '乒乓球']
nums = [26, 20, 19]
plt.bar(names, nums, width=0.6, color='skyblue')
plt.show()

堆叠柱状图

1. 堆叠柱状图不仅可以展示每一个分类的总量,还能展示该分类包含的每个小分类的大小及占比,因此非常适合处理部分与整体的关系。


2. 多调用了一次 plt.bar() 方法,并传入了 bottom 参数。每调用一次 plt.bar() 方法就会画出对应的柱状图,而 bottom  参数作用就是控制柱状图低端的位置。


import matplotlib.pyplot as plt
plt.rcParams['font.family'] = ['SimHei']
 
names = ['篮球', '羽毛球', '乒乓球']
nums_boy = [16, 5, 11]
nums_girl = [10, 15, 8]
 
plt.bar(names, nums_boy, width=0.6, color='skyblue', label='男')
plt.bar(names, nums_girl, bottom=nums_boy, width=0.6, color='pink', label='女')
plt.legend()
plt.show()

分组柱状图

1. 分组柱状图经常用于不同组间数据的比较,这些组都包含了相同分类的数据。


2. 首先使用 np.arange(3) 方法创建了一个数组 x,值为 [ 0 1 2 ],并定义了一个变量 width 用于指定柱子的宽度。


3. 在调用 plt.bar() 时,第一个参数不再是刻度上的标签,而是对应的刻度。以 [ 0 1 2 ] 为基准,分别加上和减去柱子的宽度得到 [-0.15 0.85 1.85] 和 [0.15 1.15 2.15],这些刻度将分别作为两组柱子的中点,并且柱子的宽度为 0.3。


4. 因此,我们还要调用 plt.xticks() 方法来将 x 轴上刻度改成对应的标签。该方法的第一个参数是要更改的刻度序列,第二个参数是与之对应的标签序列。

import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.family'] = ['SimHei']
x = np.arange(3)
width = 0.3
 
names = ['篮球', '羽毛球', '乒乓球']
nums_boy = [16, 5, 11]
nums_girl = [10, 15, 8]
 
plt.bar(x - width / 2, nums_boy, width=width, color='skyblue', label='男')
plt.bar(x + width / 2, nums_girl, width=width, color='pink', label='女')
plt.xticks(x, names)
plt.legend()
plt.show()

饼图

1. 饼图用于表示不同分类的占比情况,通过弧度大小来对比各种分类。


2. 饼图的画法很简单,只要传入数据和对应的标签给 plt.pie() 方法即可。但为了让饼图更加直观清晰,需要了解一些额外的参数:参数 autopct 则给饼图自动添加百分比显示。


3. 还能通过 explode 参数来让饼图中的某一部分突出显示,来强调某项数据。


4. 默认 explode 参数里的元素都是 0,我们将需要突出显示的部分对应位置的值设大一点,就能将对应的区块抽离出来突出显示。这个数值越大,抽离的效果就越明显。

import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.family'] = ['SimHei']
 
data = [64745.2, 364835.2, 489700.8]
labels = ['第一产业', '第二产业', '第三产业']
explode = (0.1, 0, 0)
 
plt.pie(data, explode=explode, labels=labels, autopct='%0.1f%%')
plt.show()

致谢

感谢您花时间阅读这篇文章!如果您对本文有任何疑问、建议或是想要分享您的看法,请不要犹豫,在评论区留下您的宝贵意见。每一次互动都是我前进的动力,您的支持是我最大的鼓励。期待与您的交流,让我们共同成长,探索技术世界的无限可能!

相关文章
|
23天前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。
|
23天前
|
机器学习/深度学习 数据挖掘 Python
Python编程入门——从零开始构建你的第一个程序
【10月更文挑战第39天】本文将带你走进Python的世界,通过简单易懂的语言和实际的代码示例,让你快速掌握Python的基础语法。无论你是编程新手还是想学习新语言的老手,这篇文章都能为你提供有价值的信息。我们将从变量、数据类型、控制结构等基本概念入手,逐步过渡到函数、模块等高级特性,最后通过一个综合示例来巩固所学知识。让我们一起开启Python编程之旅吧!
|
23天前
|
存储 Python
Python编程入门:打造你的第一个程序
【10月更文挑战第39天】在数字时代的浪潮中,掌握编程技能如同掌握了一门新时代的语言。本文将引导你步入Python编程的奇妙世界,从零基础出发,一步步构建你的第一个程序。我们将探索编程的基本概念,通过简单示例理解变量、数据类型和控制结构,最终实现一个简单的猜数字游戏。这不仅是一段代码的旅程,更是逻辑思维和问题解决能力的锻炼之旅。准备好了吗?让我们开始吧!
|
13天前
|
设计模式 缓存 开发者
Python中的装饰器:从入门到实践####
本文深入探讨了Python中强大的元编程工具——装饰器,它能够以简洁优雅的方式扩展函数或方法的功能。通过具体实例和逐步解析,文章不仅介绍了装饰器的基本原理、常见用法及高级应用,还揭示了其背后的设计理念与实现机制,旨在帮助读者从理论到实战全面掌握这一技术,提升代码的可读性、可维护性和复用性。 ####
|
23天前
|
设计模式 缓存 开发框架
Python中的装饰器:从入门到实践####
本文深入探讨了Python中装饰器的工作原理与应用,通过具体案例展示了如何利用装饰器增强函数功能、提高代码复用性和可读性。读者将学习到装饰器的基本概念、实现方法及其在实际项目开发中的实用技巧。 ####
26 3
|
25天前
|
机器学习/深度学习 数据挖掘 开发者
Python编程入门:理解基础语法与编写第一个程序
【10月更文挑战第37天】本文旨在为初学者提供Python编程的初步了解,通过简明的语言和直观的例子,引导读者掌握Python的基础语法,并完成一个简单的程序。我们将从变量、数据类型到控制结构,逐步展开讲解,确保即使是编程新手也能轻松跟上。文章末尾附有完整代码示例,供读者参考和实践。
|
19天前
|
机器学习/深度学习 存储 数据挖掘
Python 编程入门:理解变量、数据类型和基本运算
【10月更文挑战第43天】在编程的海洋中,Python是一艘易于驾驭的小船。本文将带你启航,探索Python编程的基础:变量的声明与使用、丰富的数据类型以及如何通过基本运算符来操作它们。我们将从浅显易懂的例子出发,逐步深入到代码示例,确保即使是零基础的读者也能跟上步伐。准备好了吗?让我们开始吧!
25 0
|
3月前
|
Python
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
|
3月前
|
数据可视化 数据挖掘 Linux
震撼发布!Python数据分析师必学,Matplotlib与Seaborn数据可视化实战全攻略!
在数据科学领域,数据可视化是连接数据与洞察的桥梁,能让复杂的关系变得直观。本文通过实战案例,介绍Python数据分析师必备的Matplotlib与Seaborn两大可视化工具。首先,通过Matplotlib绘制基本折线图;接着,使用Seaborn绘制统计分布图;最后,结合两者在同一图表中展示数据分布与趋势,帮助你提升数据可视化技能,更好地讲述数据故事。
56 1
|
3月前
|
存储 数据可视化 数据挖掘
揭秘!Matplotlib与Seaborn联手,如何让Python数据分析结果一目了然,惊艳全场?
在数据驱动时代,高效直观地展示分析结果至关重要。Python中的Matplotlib与Seaborn是两大可视化工具,结合使用可生成美观且具洞察力的图表。本文通过分析某电商平台的商品销量数据集,展示了如何利用这两个库揭示商品类别与月份间的销售关系及价格对销量的影响。首先使用Matplotlib绘制月份销量分布直方图,再借助Seaborn的箱线图进一步探索不同类别和价格区间下的销量稳定性。
66 10