发布网友 发布时间:2022-04-25 12:36
共1个回答
热心网友 时间:2022-05-18 11:16
GRCH37,b37和hs37d5: 可以将hs37d5理解为b37的升级版,b37为GRCH37的升级版。b37在GRCH37的基础上进行命名和坐标系统规范,包括线粒体和GL开头的一些没有定位到基因组的序列;
hs37d5在b37基础上增加了一条病毒序列(疱疹病毒),一条decoy序列(hs37d5,来自BAC或者质粒克隆等,没有具体的变异检测的作用,但是能增加比对率,以及提升正确的比对率),并且在Y染色体上把X,Y染色体的同源区mark 成了N。
hg19与hs37d5的坐标系统一样,1-X,Y染色体碱基信息一模一样。线粒体有差别(版本不一样,hs37d5用的是修正版的NC_012920,而hg19是老版NC_001807),建议使用NC_012920(也有基于hg19更新线粒体信息的hg19基因组)。
扩展资料:
GSDB数据库中条目的格式与GenBank中的基本一致,主要区别是GSDB数据库中增加了GSDBID识别符。GSDB数据库可以通过万维网查询,也可以使用服务器-客户机关系数据库方式查询。无论用哪种方法,熟悉数据库结构化查询语言SQL,对更好地使用GSDB数据库会有所帮助。
该数据库采用服务器-客户机关系数据库模式,大规模测序机构可以通过计算机网络向服务器提交数据,并在发送之前对数据进行检查,以确保数据的质量。
参考资料来源:百度百科-基因组序列