monocle 拟时序分析
发布网友
发布时间:2022-10-18 05:10
我来回答
共1个回答
热心网友
时间:2023-11-08 02:07
拟时序分析指的是根据不同细胞亚群基因表达量随时间的变化情况,构建细胞谱系发育。这个时间并不是真的时间,而是一个虚拟的时序列,是指细胞与细胞之间的转化和演替的顺序和轨迹。
monocle是我们经常用的拟时序分析工具,可以使用bioconctor安装。目前已经更新到第3版本,monocle3安装有点麻烦,可以参考官网 https://cole-trapnell-lab.github.io/monocle3/ 。
Monocle使用一种算法来学习每个细胞必须经历的基因表达变化序列,作为动态生物学过程的一部分。一旦它了解了基因表达变化的整体“轨迹”,Monocle就可以将每个细胞放置在轨迹中的适当位置。Monocle依靠一种叫做反向图嵌入的机器学习技术来构建单细胞轨迹 https://www.nature.com/articles/nmeth.4402
单细胞测序一般使用seurat分析,monocle分析seurat对象是需要进行一些处理。
monocle2拟时序分析主要基于以下三个步骤
1、基因筛选:Monocle可选取感兴趣的基因(差异基因),并利用这些基因来构造数据。
2、降低维度:选择用于细胞排序的基因,对数据进行降维处理。
3、pseudotime对细胞排序:通过将表达数据投影到较低维空间,构建细胞间的分化轨迹。
结果如下图,各个点代表一个细胞,具有相似状态的细胞被聚在一起。每个分支点代表一个可能的生物学过程的决策点。
细胞间状态转换相关基因表达热图如下图,热图显示大体分为两类基因,一类从低到高表达,一类从高到底表达,还有一类中间高表达(也可多分几类)。类似基因共表达模块,具有相同表达模式的基因聚在一起。如下图第3个cluster基因,在分化的起始高表达,随着拟时间的增加,表达量逐渐降低。那么这些模块的基因可能就存在这某个生物学的功能或者通路,接下来就可以进行进一步的挖掘。
按聚类数3划分基因聚类关系,可以提取这三部分基因进行go、kegg注释。
TSCAN
文献 10.1093/nar/gkw430
http://www.bioconctor.org/packages/release/bioc/html/TSCAN.html