单细胞RNA速率分析: scVelo入门教程

简介: 单细胞RNA速率分析: scVelo入门教程

引言

本系列讲解 单细胞(scRNA-seq)中RNA“速率”分析 教程,持续更新,欢迎关注,转发!

简介

接下来,将简单介绍如何使用 scVelo。当你熟悉基本操作后,后续教程会直接带你进入 RNA 速率、潜在时间、驱动因子识别等高级分析内容。

scVelo 的输入数据主要包括两个计数矩阵,分别记录未成熟(未剪接)和成熟(已剪接)的丰度信息。这些数据可以通过标准测序流程获得,例如使用 velocytokallisto 计数工具。

scVelo 工作流程概览

首先,导入 Scanpyscvelo 库:

import scanpy as sc
import scvelo as scv

为了获得更美观的可视化效果,你可以将 matplotlib 的设置调整为默认样式:

scv.set_figure_params()

读取数据

使用以下命令读取你的数据文件(如 loom、h5ad、csv 等格式):

adata = sc.read(filename, cache=True)

读取后,数据将被存储为多个部分:数据矩阵(adata.X)、细胞或观察的注释信息(adata.obs)、基因或变量的注释(adata.var)、非结构化注释(如图,存储在 adata.uns 中),以及额外的数据层(adata.layers),其中包含剪接和未剪接的计数信息。

如果你已经有一个经过预处理的 adata 对象,可以直接通过以下方式合并剪接和未剪接的计数:

ldata = sc.read(filename.loom, cache=True)
adata = scv.utils.merge(adata, ldata)

如果你还没有自己的数据集,也可以使用内置的数据集进行练习,例如:

adata = scv.datasets.pancreas()

整个工作流程通常包括三个步骤:预处理(scv.pp.)、分析(scv.tl.)和绘图(scv.pl.*)。

基本预处理

在完成基因选择和标准化等基本预处理后,会计算一阶和二阶矩(均值和未中心化方差),用于后续的速率估计:

scv.pp.filter_and_normalize(adata, **params)
scv.pp.moments(adata, **params)

速率工具

该软件的核心功能是高效且稳健地估算速率。这些速率是通过以下方法计算得出的:

scv.tl.velocity(adata, mode='stochastic', **params)

速率是在基因表达空间中的向量,通过求解转录动态的随机模型来获得。如果设置 mode='deterministic',则可以得到确定性模型的解。

如果设置 mode='dynamical',则可以得到动态模型的解,但在此之前需要先运行 scv.tl.recover_dynamics(adata, **params)。

计算出的速率会被存储在 adata.layers 中,与计数矩阵的存储方式相同。

速率会被投影到低维嵌入中,方法是将其转化为可能的细胞转换。具体来说,对于每一个速率向量,会找到与该方向一致的可能的细胞转换。细胞从一个状态转换到另一个状态的概率是通过计算余弦相似性(在潜在的细胞转换和速率向量之间)得出的,并存储在一个名为“速率图”的矩阵中:

scv.tl.velocity_graph(adata, **params)

可视化

最终,速率可以在单细胞水平上,或者以网格线、流线的形式,在任何嵌入(例如 UMAP)中进行投影和可视化:

scv.pl.velocity_embedding(adata, basis='umap', **params)
scv.pl.velocity_embedding_grid(adata, basis='umap', **params)
scv.pl.velocity_embedding_stream(adata, basis='umap', **params)

每个工具模块都配有相应的绘图功能,方便你详细检查分析结果,例如:

scv.pl.velocity(adata, var_names=['gene_A', 'gene_B'], **params)
scv.pl.velocity_graph(adata, **params)
相关文章
|
数据可视化
绘制热图时看不出颜色差异?四种方式转换处理使结果显而“易”见
绘制热图时看不出颜色差异?四种方式转换处理使结果显而“易”见
20900 2
|
7月前
|
编解码 算法 数据可视化
Scanpy 分析 scRNA-seq:细胞类型注释
Scanpy 分析 scRNA-seq:细胞类型注释
Scanpy 分析 scRNA-seq:细胞类型注释
|
5月前
|
存储 数据可视化 数据挖掘
单细胞分析: Scanpy 核心绘图 (1)
单细胞分析: Scanpy 核心绘图 (1)
|
6月前
|
存储 编解码 移动开发
空间转录组:数据格式介绍
空间转录组:数据格式介绍
空间转录组:数据格式介绍
|
数据可视化
R语言多图合成:优雅地在一个画布上展示多个图形
【8月更文挑战第30天】R语言提供了多种方法来实现多图合成,从基础的`par()`函数到高级的`gridExtra`、`ggplot2`和`cowplot`包,每种方法都有其独特的优势和应用场景。通过掌握这些技术,你可以根据实际需求灵活地组合图形,从而更高效地展示和解读数据。希望本文能为你提供一些有益的参考和启示。
|
数据采集 数据挖掘 数据库
单细胞分析 | 使用 Monocle 3 进行发育轨迹分析
单细胞分析 | 使用 Monocle 3 进行发育轨迹分析
1231 0
单细胞分析 | 使用 Monocle 3 进行发育轨迹分析
|
机器学习/深度学习 人工智能 算法
高性价比发文典范——101种机器学习算法组合革新骨肉瘤预后模型
随着高通量测序技术的飞速发展和多组学分析的广泛应用,科研人员在探索生物学奥秘时经常遇到一个令人又爱又恼的问题:如何从浩如烟海的数据中挖掘出潜在的疾病关联靶点?又如何构建一个全面而有效的诊断或预后模型?只有通过优雅的数据挖掘、精致的结果展示、深入的讨论分析,并且辅以充分的湿实验验证,我们才能锻造出一篇兼具深度与广度的“干湿结合”佳作。
1550 0
高性价比发文典范——101种机器学习算法组合革新骨肉瘤预后模型
|
人工智能 数据可视化
跟SCI学umap图| ggplot2 绘制umap图,坐标位置 ,颜色 ,大小还不是你说了算
跟SCI学umap图| ggplot2 绘制umap图,坐标位置 ,颜色 ,大小还不是你说了算
1791 1
|
数据可视化 数据挖掘 C#
单细胞工具箱|Cell Ranger-V6.0 开启单细胞之旅(上)
单细胞工具箱|Cell Ranger-V6.0 开启单细胞之旅(上)
1115 1
|
数据可视化 Go
clusterProfiler|GSEA富集分析及可视化
clusterProfiler|GSEA富集分析及可视化
1294 0