还不会Python数据可视化? 手把手教你用 Matplotlib 实现数据可视化(珍藏版上)

简介: 还不会Python数据可视化? 手把手教你用 Matplotlib 实现数据可视化(珍藏版上)

介绍

在使用机器学习方法解决问题的过程中,一定会遇到需要针对数据进行绘图的场景。


Matplotlib 是支持 Python 语言的开源绘图库,因为其支持丰富的绘图类型、简单的绘图方式以及完善的接口文档,深受 Python 工程师、科研学者、数据工程师等各类人士的喜欢


Matplotlib 拥有着十分活跃的社区以及稳定的版本迭代,当我们在学习机器学习的课程时,掌握 Matplotlib 的使用无疑是最重要的准备工作之一


在使用 Notebook 环境绘图时,需要先运行 Jupyter Notebook 的魔术命令 %matplotlib inline


这条命令的作用是将 Matplotlib 绘制的图形嵌入在当前页面中。而在桌面环境中绘图时,不需要添加此命令,而是在全部绘图代码之后追加 plt.show()



简单图形绘制


使用 Matplotlib 提供的面向对象 API,需要导入 pyplot 模块,并约定简称为 plt


快速上手

import  matplotlib.pyplot as plt
%matplotlib inline
plt.plot([1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1])

8.png


前面,我们从 Matplotlib 中导入了 pyplot 绘图模块,并将其简称为 plt


pyplot 模块是 Matplotlib 最核心的模块,几乎所有样式的 2D 图形都是经过该模块绘制出来的



自定义X/Y轴

plt.plot() 是 pyplot 模块下面的直线绘制(折线图)方法类. 示例中包含了一个 [1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1] 列表,Matplotlib 会默认将该列表作为 y 值,而 x 值会从 0 开始依次递增。


当然,如果你需要自定义横坐标值,只需要传入两个列表即可


plt.plot([1,2,3],
         [1, 2, 3])


1.png



图表实现

汇总

上面演示了如何绘制一个简单的折线图


那么,除了折线图,我们平常还要绘制柱状图、散点图、饼状图等等. 这些图应该怎样绘制呢?


pyplot 模块中 pyplot.plot 方法是用来绘制折线图的


你应该会很容易联想到,更改后面的方法类名就可以更改图形的样式。


的确,在 Matplotlib 中,大部分图形样式的绘制方法都存在于 pyplot 模块中。例如:image.png

下面,我们参考折线图的绘制方法,尝试绘制几个简单的图形。



正弦曲线图

matplotlib.pyplot.plot(*args, **kwargs) 方法严格来讲可以绘制线形图或者样本标记


其中,*args 允许输入单个 y 值或 x,y 值


例如,我们这里绘制一张自定义 x,y 的正弦曲线图


import numpy as np
# 在 -2PI 和 2PI 之间等间距生成 1000 个值,也就是 X 坐标
X = np.linspace(-2*np.pi, 2*np.pi, 1000)
# 计算 y 坐标
y = np.sin(X)
# 向方法中 `*args` 输入 X,y 坐标
plt.plot(X, y)

2.png


正弦曲线就绘制出来了。但值得注意的是,pyplot.plot 在这里绘制的正弦曲线,实际上不是严格意义上的曲线图,而在两点之间依旧是直线。


这里看起来像曲线是因为样本点相互挨得很近。



柱状图

柱形图 matplotlib.pyplot.bar(*args, **kwargs) 大家应该都非常了解了


这里,我们直接用上面的代码,仅把 plt.plot(X, y) 改成 plt.bar(X, y) 试一下

plt.bar([1,2,3],[1,2,3])

3.png



散点图

散点图 matplotlib.pyplot.scatter(*args, **kwargs) 就是呈现在二维平面的一些点,这种图像的需求也是非常常见的


比如,我们通过 GPS 采集的数据点,它会包含经度以及纬度两个值,这样的情况就可以绘制成散点图

# X,y 的坐标均有 numpy 在 0 到 1 中随机生成 1000 个值
X = np.random.ranf(1000)
y = np.random.ranf(1000)
# 向方法中 `*args` 输入 X,y 坐标
plt.scatter(X, y)

4.png


饼图

饼状图 matplotlib.pyplot.pie(*args, **kwargs) 在有限列表以百分比呈现时特别有用,你可以很清晰地看出来各类别之间的大小关系,以及各类别占总体的比例。


plt.pie([1, 2, 3, 4, 5])


5.png


量场图

量场图 matplotlib.pyplot.quiver(*args, **kwargs) 就是由向量组成的图像,在气象学等方面被广泛应用


从图像的角度来看,量场图就是带方向的箭头符号

X, y = np.mgrid[0:10, 0:10]
plt.quiver(X, y)

6.png


等高线图

中学学习地理的时候,我们就知道等高线了


等高线图 matplotlib.pyplot.contourf(*args, **kwargs) 是工程领域经常接触的一类图,它的绘制过程稍微复杂一些


# 生成网格矩阵
x = np.linspace(-5, 5, 500)
y = np.linspace(-5, 5, 500)
X, Y = np.meshgrid(x, y)
# 等高线计算公式
Z = (1 - X / 2 + X ** 3 + Y ** 4) * np.exp(-X ** 2 - Y ** 2)
plt.contourf(X, Y, Z)


7.png



图形样式

上面,我们绘制了简单的基础图形,但这些图形都不美观


我们已经知道了,线形图通过 matplotlib.pyplot.plot(*args, **kwargs) 方法绘出


其中,args 代表数据输入,而 kwargs 的部分就是用于设置样式参数了。



折线图

二维线形图 包含的参数 超过 40 余项,其中常用的也有 10 余项,选取一些比较有代表性的参数列举如下:

参数 含义
alpha= 设置线型的透明度,从 0.0 到 1.0
color=

设置线型的颜色

fillstyle= 设置线型的填充样式
linestyle= 设置线型的样式
linewidth= 设置线型的宽度
marker= 设置标记点的样式
…… ……


至于每一项参数包含的设置选项,大家需要通过 官方文档 详细了解


下面,我们重新绘制一个三角函数图形


# 在 -2PI 和 2PI 之间等间距生成 1000 个值,也就是 X 坐标
X = np.linspace(-2 * np.pi, 2 * np.pi, 1000)
# 计算 sin() 对应的纵坐标
y1 = np.sin(X)
# 计算 cos() 对应的纵坐标
y2 = np.cos(X)
# 向方法中 `*args` 输入 X,y 坐标
plt.plot(X, y1, color='r', linestyle='--', linewidth=2, alpha=0.8)
plt.plot(X, y2, color='b', linestyle='-', linewidth=2)

8.png

散点图

散点图也是相似的,它们的很多样式参数都是大同小异,需要大家阅读 官方文档 详细了解。

参数

含义

s=

散点大小

c= 散点颜色
marker= 散点样式
cmap= 定义多类别散点的颜色
alpha= 点的透明度
edgecolors= 散点边缘颜色


# 生成随机数据
x = np.random.rand(1000)
y = np.random.rand(1000)
colors = np.random.rand(1000)
size = np.random.normal(50, 60, 1000)
# 绘制散点图
plt.scatter(x, y, s=size, c=colors)

9.png

饼图

饼状图通过 matplotlib.pyplot.pie() 绘出


我们也可以进一步设置它的颜色、标签、阴影等各类样式

# 各类别标签
label = 'a','b','c','d'  
# 各类别颜色
color = 'r', 'g', 'r', 'g'
# 各类别占比
size = [1, 2, 3, 4]  
# 各类别的偏移半径
explode = (0, 0, 0, 0, 0.2)  
# 绘制饼状图
plt.pie(size, colors=color, explode=explode,
        labels=label, shadow=True, autopct='%1.1f%%')
# 饼状图呈正圆
plt.axis('equal')

10.png



目录
相关文章
|
9天前
|
数据可视化 Python
Python中的数据可视化:使用Matplotlib绘制图表
【9月更文挑战第11天】在这篇文章中,我们将探索如何使用Python的Matplotlib库来创建各种数据可视化。我们将从基本的折线图开始,然后逐步介绍如何添加更多的功能和样式,以使您的图表更具吸引力和信息量。无论您是数据科学家、分析师还是任何需要将数据转化为视觉形式的专业人士,这篇文章都将为您提供一个坚实的起点。让我们一起潜入数据的海洋,用视觉的力量揭示其背后的故事。
33 16
|
7天前
|
数据可视化 数据挖掘 API
Python中的数据可视化:从基础到进阶
【9月更文挑战第13天】在数字世界中,数据可视化是连接复杂信息与人类直觉的桥梁。本文将通过Python语言,探索如何从零开始构建数据可视化技能,逐步深入到高级技巧,让你能够将抽象的数字转化为直观的故事。我们将一起学习如何使用Matplotlib、Seaborn等库来绘制图表,并最终掌握如何利用Pandas对数据集进行深度分析与可视化展示。
|
14天前
|
数据可视化 数据挖掘 数据处理
Python中数据可视化的魔法——使用Matplotlib和Pandas
【9月更文挑战第5天】在Python的世界里,数据可视化是连接复杂数据与人类直觉的桥梁。本篇文章将带领读者探索如何使用Matplotlib和Pandas这两个强大的库来揭示数据背后的故事。我们将从基础概念开始,逐步深入到高级技巧,让每一位读者都能轻松创建引人入胜的数据可视化图表,使数据分析变得既直观又有趣。
57 14
|
8天前
|
机器学习/深度学习 数据采集 监控
Pandas与Matplotlib:Python中的动态数据可视化
Pandas与Matplotlib:Python中的动态数据可视化
|
21天前
|
数据可视化 物联网 区块链
探索Python中的数据可视化:使用Matplotlib和Seaborn绘制图表探索未来:区块链、物联网与虚拟现实的融合趋势与应用前景
【8月更文挑战第30天】本文旨在引导读者通过Python编程语言,利用Matplotlib和Seaborn库,轻松掌握数据可视化技术。文章以浅显易懂的语言,结合实用的代码示例,从基础的图表绘制到高级定制功能,逐步深入讲解如何在数据分析中运用这些工具。无论你是编程新手还是希望提升可视化技能的开发者,都能在这篇文章中找到有价值的信息,让你的数据“活”起来。
|
21天前
|
机器学习/深度学习 数据可视化 数据挖掘
Python中的数据可视化:使用Matplotlib库绘制图表
【8月更文挑战第30天】数据可视化是数据科学和分析的关键组成部分,它帮助我们以直观的方式理解数据。在Python中,Matplotlib是一个广泛使用的绘图库,提供了丰富的功能来创建各种类型的图表。本文将介绍如何使用Matplotlib库进行数据可视化,包括安装、基本概念、绘制不同类型的图表以及自定义图表样式。我们将通过实际代码示例来演示如何应用这些知识,使读者能够轻松地在自己的项目中实现数据可视化。
|
2月前
|
数据可视化 数据挖掘 Python
数据界的颜值担当!Python数据分析遇上Matplotlib、Seaborn,可视化美出新高度!
【7月更文挑战第24天】在数据科学领域,Python的Matplotlib与Seaborn将数据可视化升华为艺术,提升报告魅力。Matplotlib作为基石,灵活性强,新手友好;代码示例展示正弦波图的绘制与美化技巧。Seaborn针对统计图表,提供直观且美观的图形,如小提琴图,增强数据表达力。两者结合,创造视觉盛宴,如分析电商平台销售数据时,Matplotlib描绘趋势,Seaborn揭示类别差异,共塑洞察力强的作品,使数据可视化成为触动人心的艺术。
47 7
|
2月前
|
数据可视化 数据挖掘 Python
惊呆了!Python数据分析师如何用Matplotlib、Seaborn秒变数据可视化大师?
【7月更文挑战第24天】在数据驱动时代,分析师穿梭数字海洋揭示故事,数据可视化如魔法棒般将复杂数据转化成直观图形。Matplotlib与Seaborn成为黄金搭档:前者作为基础绘图库提供高度定制化选项;后者在其上构建,简化复杂图表绘制并增强美观度。两者结合,助力分析师高效完成任务。
27 6
|
2月前
|
数据可视化 数据挖掘 开发者
数据可视化新纪元!Python + Matplotlib + Seaborn,让你的数据故事生动起来!
【7月更文挑战第23天】在数据驱动时代,Python通过Matplotlib与Seaborn引领数据可视化新纪元。Matplotlib基础强大,提供广泛绘图选项;Seaborn则简化流程,图表更美观,适合快速可视化。两者结合,轻松应对复杂定制需求,将数据转化为生动故事,支持决策与交流。
29 6
|
2月前
|
机器学习/深度学习 数据可视化 开发者
视觉的力量!Python 机器学习模型评估,Matplotlib 与 Seaborn 如何助力决策更明智?
【7月更文挑战第23天】在Python机器学习中,模型评估不可或缺。Matplotlib与Seaborn作为数据可视化工具,助力洞察模型性能。Matplotlib基础灵活,构建复杂图表;Seaborn在其上层,简化绘图,提升美观。从折线图追踪损失到条形图对比准确率,两者互补,促进高效决策制定。尽管Matplotlib掌控力强,但Seaborn友好快捷,适于统计图形。结合使用,可将数据转化成深刻见解。
31 6