单细胞测序最好的教程(八): 基于marker的自动注释
发布网友
发布时间:2024-10-13 21:34
我来回答
共1个回答
热心网友
时间:2024-11-13 20:10
在单细胞测序最好的教程(八)中,作者重点讲解了基于marker的自动注释方法,旨在提高对未知组织细胞类型的识别效率。通过自动注释,初学者可以快速了解细胞类型,无需从头开始。教程详细区分了依赖GPU的深度学习模型和不需GPU的统计学模型,以SCSA为例,它通过比较细胞簇的特异性marker与数据库中的细胞类型marker,进行自动分类,可能将差异性不大的细胞标记为Unknown。使用预先注释的人类骨髓数据进行测试,可以对比手动注释的准确性。
在自动注释过程中,首先对单细胞测序数据进行聚类,如使用SCSA模型。SCSA的准确度曾被质疑,但随着数据库的更新,如omicverse整合和CellMarker的升级,算法性能得到提升。ov.single.pySCSA函数有特定参数设置,比如celltype和target,需要使用pySCSA_2023_v2_plus.db数据库。注释结果显示,自动注释有时会出现误分类,如将Hematopoietic stem cell标注错误,而neuron这类细胞类型由于自动注释的局限性未被识别。
除了CellMarker,还可以尝试panglaodb数据库,它能提供更细化的细胞类型注释,如红细胞和T细胞亚群。然而,实际应用中,对于大类注释,精细化的细胞类型可能并不必要。教程还介绍了获取特定细胞类型marker的函数,以及未来将增加其他物种数据库的支持。