火山图|给你geneList,帮我标到火山图上

简介: 火山图|给你geneList,帮我标到火山图上



火山图(Volcano Plot)常用于展示基因表达差异的分布,横坐标常为Fold change(倍数),越偏离中心差异倍数越大;纵坐标为P value(P值),值越大差异越显著。得名原因也许是因为结果图像火山吧!

ggplot2-plotly|让你的火山图“活”过来

火山图只标示指定基因?这需求都遇到过吧。


一 载入R包,数据

library(ggplot2)
library(openxlsx)
library(dplyr)
#绘制火山图数据
data <- read.xlsx("火山图.xlsx", sheet = 1)
head(data) #查看数据,主要有P值,Fold change和基因ID即可。

二 绘制火山图(标示最显著的基因)

2.1 先根据阈值分出上调和下调基因;

data$change <- as.factor(ifelse(data$adj.P.Val < 0.01 & abs(data$logFC) > 1,
                               ifelse(data$logFC > 1,'UP','DOWN'),'NOT'))

2.2 标示差异显著的基因

data$sign <- ifelse(data$adj.P.Val < 0.001 & abs(data$logFC) > 2.5,data$GENE_SYMBOL,NA)
head(data)

2.3 绘制火山图

ggplot(data = data, aes(x = logFC, y = -log10(adj.P.Val), color = change)) +
 geom_point(alpha=0.8, size = 1) +
 theme_bw(base_size = 15) +
 theme(panel.grid.minor = element_blank(),panel.grid.major = element_blank()) +
 geom_hline(yintercept=2 ,linetype=4) +
 geom_vline(xintercept=c(-1,1) ,linetype=4 ) +
 scale_color_manual(name = "", values = c("red", "green", "black"), limits = c("UP", "DOWN", "NOT")) +
 geom_text(aes(label = sign), size = 3)


了解一下ggplot2绘图的方式,标示的基因就是各个基因的text,然后想办法将其赋予到一个 aes 中即可。


三 标示指定基因

和上面类似,将指定基因添加到绘制数据中即可。

3.1 读入含有geneList的文件

gene <- read.xlsx("火山图.xlsx", sheet = 2)
gene$geneList <- gene$gene

额外生成一列相同列是为了后面合并后还有一列存在,这一列用于标示基因。(方法有点笨)

3.2 合并火山图数据

data2 <- data %>%
 left_join(gene,by = c("GENE_SYMBOL" = "gene"))
head(data2)

增加了geneList列,为了后面使用text的方式添加上基因。

3.3 标示文件中的指定基因

ggplot(data = data2, aes(x = logFC, y = -log10(adj.P.Val), color = change)) +
 geom_point(alpha=0.8, size = 1) +
 theme_bw(base_size = 15) +
 theme(panel.grid.minor = element_blank(),panel.grid.major = element_blank()) +
 geom_hline(yintercept=2 ,linetype=4) +
 geom_vline(xintercept=c(-1,1) ,linetype=4 ) +
 scale_color_manual(name = "", values = c("red", "green", "black"), limits = c("UP", "DOWN", "NOT")) +
 geom_text(aes(label = geneList), size = 5,color = "blue")

3.4  ggrepel 解决重叠问题

如果目标标示基因太多会导致重叠,可使用ggrepal函数

library(ggrepel)
ggplot(data = data2, aes(x = logFC, y = -log10(adj.P.Val), color = change)) +
 geom_point(alpha=0.8, size = 1) +
 theme_bw(base_size = 15) +
 theme(panel.grid.minor = element_blank(),panel.grid.major = element_blank()) +
 geom_hline(yintercept=2 ,linetype=4) +
 geom_vline(xintercept=c(-1,1) ,linetype=4 ) +
 scale_color_manual(name = "", values = c("red", "green", "black"), limits = c("UP", "DOWN", "NOT")) +
 geom_label_repel(aes(label=geneList), fontface="bold", color="grey50", box.padding=unit(0.35, "lines"), point.padding=unit(0.5, "lines"), segment.colour = "grey50")

呐,可以随意标示感兴趣的基因了。

相关文章
|
6月前
|
数据采集 算法 安全
CVPR 2024:给NeRF开透视眼!稀疏视角下用X光进行三维重建,9类算法工具包全开源
【6月更文挑战第28天】CVPR 2024亮点:SAX-NeRF框架开源!融合X光与NeRF,提升3D重建效果。X3D数据集验证,Lineformer+MLG策略揭示物体内部结构,增强几何理解。虽有计算成本及泛化挑战,但为计算机视觉和医学影像开辟新路径。[论文链接](https://arxiv.org/abs/2311.10959)**
177 5
|
7月前
|
编解码 人工智能 自然语言处理
七火山发布Etna文生视频模型
【2月更文挑战第17天】七火山发布Etna文生视频模型
848 2
七火山发布Etna文生视频模型
|
人工智能 数据挖掘
这图怎么画 | 相关分析棒棒糖图
这图怎么画 | 相关分析棒棒糖图
131 0
|
7月前
|
数据可视化
实现绘制Sankey桑基图(河流图、分流图)流程数据可视化
实现绘制Sankey桑基图(河流图、分流图)流程数据可视化
|
数据可视化 关系型数据库 数据挖掘
scRNA分析|一(尽)文(力)解决你的单细胞火山图问题
scRNA分析|一(尽)文(力)解决你的单细胞火山图问题
712 0
|
数据可视化 数据挖掘 Linux
转录组下游分析丨利用limma包进行差异表达分析,结果可视化绘制火山图和热图
转录组下游分析丨利用limma包进行差异表达分析,结果可视化绘制火山图和热图
|
存储 数据可视化 atlas
maftools | 从头开始绘制发表级oncoplot(瀑布图)
maftools | 从头开始绘制发表级oncoplot(瀑布图)
431 0
|
数据可视化 Go
一行代码绘制高分SCI火山图
经过一段时间的文献阅读和资料查询,终于找到了一个好用而且简单的包——ggVolcano, 它是一个基于R语言和ggplot2绘图包开发的生物信息学数据可视化工具。它可以用于绘制火山图(Volcano plot),帮助研究者分析高通量实验数据,如基因表达谱或蛋白质组学数据,以识别差异表达或差异富集的基因或蛋白质。
372 0
论文技术路线图如何绘制?
本文介绍基于Visio软件绘制技术路线图、流程图、工作步骤图等的方法~
583 1
|
机器学习/深度学习 人工智能 自然语言处理
中山大学团队使用端到端图生成架构进行分子图编辑的逆合成预测
中山大学团队使用端到端图生成架构进行分子图编辑的逆合成预测
175 0