单细胞RNA速率分析: scVelo入门教程-阿里云开发者社区

单细胞RNA速率分析: scVelo入门教程

2025-05-19 436

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 单细胞RNA速率分析: scVelo入门教程

引言

本系列讲解 单细胞（scRNA-seq）中RNA“速率”分析 教程，持续更新，欢迎关注，转发！

简介

接下来，将简单介绍如何使用 scVelo。当你熟悉基本操作后，后续教程会直接带你进入 RNA 速率、潜在时间、驱动因子识别等高级分析内容。

scVelo 的输入数据主要包括两个计数矩阵，分别记录未成熟（未剪接）和成熟（已剪接）的丰度信息。这些数据可以通过标准测序流程获得，例如使用 velocyto 或 kallisto 计数工具。

scVelo 工作流程概览

首先，导入 Scanpy 和 scvelo 库：

import scanpy as sc
import scvelo as scv

为了获得更美观的可视化效果，你可以将 matplotlib 的设置调整为默认样式：

scv.set_figure_params()

读取数据

使用以下命令读取你的数据文件（如 loom、h5ad、csv 等格式）：

adata = sc.read(filename, cache=True)

读取后，数据将被存储为多个部分：数据矩阵（adata.X）、细胞或观察的注释信息（adata.obs）、基因或变量的注释（adata.var）、非结构化注释（如图，存储在 adata.uns 中），以及额外的数据层（adata.layers），其中包含剪接和未剪接的计数信息。

如果你已经有一个经过预处理的 adata 对象，可以直接通过以下方式合并剪接和未剪接的计数：

ldata = sc.read(filename.loom, cache=True)
adata = scv.utils.merge(adata, ldata)

如果你还没有自己的数据集，也可以使用内置的数据集进行练习，例如：

adata = scv.datasets.pancreas()

整个工作流程通常包括三个步骤：预处理（scv.pp.）、分析（scv.tl.）和绘图（scv.pl.*）。

基本预处理

在完成基因选择和标准化等基本预处理后，会计算一阶和二阶矩（均值和未中心化方差），用于后续的速率估计：

scv.pp.filter_and_normalize(adata, **params)
scv.pp.moments(adata, **params)

速率工具

该软件的核心功能是高效且稳健地估算速率。这些速率是通过以下方法计算得出的：

scv.tl.velocity(adata, mode='stochastic', **params)

速率是在基因表达空间中的向量，通过求解转录动态的随机模型来获得。如果设置 mode='deterministic'，则可以得到确定性模型的解。

如果设置 mode='dynamical'，则可以得到动态模型的解，但在此之前需要先运行 scv.tl.recover_dynamics(adata, **params)。

计算出的速率会被存储在 adata.layers 中，与计数矩阵的存储方式相同。

速率会被投影到低维嵌入中，方法是将其转化为可能的细胞转换。具体来说，对于每一个速率向量，会找到与该方向一致的可能的细胞转换。细胞从一个状态转换到另一个状态的概率是通过计算余弦相似性（在潜在的细胞转换和速率向量之间）得出的，并存储在一个名为“速率图”的矩阵中：

scv.tl.velocity_graph(adata, **params)

可视化

最终，速率可以在单细胞水平上，或者以网格线、流线的形式，在任何嵌入（例如 UMAP）中进行投影和可视化：

scv.pl.velocity_embedding(adata, basis='umap', **params)
scv.pl.velocity_embedding_grid(adata, basis='umap', **params)
scv.pl.velocity_embedding_stream(adata, basis='umap', **params)

每个工具模块都配有相应的绘图功能，方便你详细检查分析结果，例如：

scv.pl.velocity(adata, var_names=['gene_A', 'gene_B'], **params)
scv.pl.velocity_graph(adata, **params)

单细胞RNA速率分析: scVelo入门教程

引言

简介

scVelo 工作流程概览

读取数据

基本预处理

速率工具

可视化

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

单细胞RNA速率分析: scVelo入门教程

引言

简介

scVelo 工作流程概览

读取数据

基本预处理

速率工具

可视化

热门文章

最新文章

相关电子书