单细胞测序分析之小技巧之for循环批量处理数据和出图
发布网友
发布时间:2024-10-10 13:39
我来回答
共1个回答
热心网友
时间:2024-12-02 22:45
“harmony”整合不同平台的单细胞数据之旅,是生物信息学习的正确途径。
NGS系列文章涵盖了NGS基础、转录组分析、ChIP-seq分析、单细胞测序分析、DNA甲基化分析、重测序分析和GEO数据挖掘等内容。
在进行单细胞转录组测序分析时,如果样本较多或需要大量出图,可以尝试使用for循环进行批量处理数据和出图。
首先,介绍for循环的基础知识及一个简单示例。
for循环的基本结构是:当变量在值的范围内时,执行中括号内的操作。
例如,计算一个向量中偶数的个数,循环迭代了7次,每次迭代中,val取x的对应元素的值,并使用计数器计算x中的偶数,结果显示x包含3个偶数。
进阶使用for循环,如处理两个患者的鼻腔样本,使用cellranger后生成三个文件:barcodes、features和matrix。可以使用for循环读取数据、提取线粒体基因比例、QC筛选、在metadata中添加新的一列、进行归一化并计算高变基因,最后将P2和P3合并在一个list中。
设置batch_data_list=list(“P2”=1,”P3”=1)中,将P2和P3都赋值为1,否则P2会消失。
使用seurat中的FindAllMarkers()得到每个cluster的高变基因后,可以循环出不同clusters的vlnplot。
将cluster设为list,i代表cluster,m代表run.combined.marker的排序,使用两个for循环进行嵌套,最后在保存文件时将cluster+基因名+vlnplot结合进行保存。
每次出图都有成就感,快去尝试一下吧!
此外,也可以使用apply版的for循环,获得所有plotList,再用patchwork或cowplot进行拼图。