发布网友 发布时间:2023-03-30 07:05
共1个回答
热心网友 时间:2023-11-03 00:17
BED格式文件有3个基本列和9个可选的附加列
基本列
第一列:chrom,染色体号;
第二列:chromStart,在染色体上的起始位置,从0开始计数;
第三列:ChromEnd,在染色体上的终止位置。bed文件为左闭右开区间,当片段碱基为0-99时,记为“ChromStart=0,ChromEnd=100”。
附加列
第四列:name,行名;
第五列:score,基因组浏览器中显示的灰度设定值,介于0-1000之间,越大越黑;
第六列:正负链标记,“+”、“-”、“.”(no strand);
第七列:thickStart,编码起始位置;
第八列:thickEnd,编码终止位置;
第九列:itemRgb-R,G,B,当itemRgb设置为“On”,行会显示颜色;
第十列:blockCount,外显子数量;
第十一列:BlockSizes,外显子大小列表,逗号分隔;
第十二列:blockStarts,外显子起始列表位置,逗号分隔,是与chromStart相对的一个位置。
增加两端长度
增加一端长度
链特异性影响
genomic features通常使用bed 或者gff文件表示,两者最基本的信息就是染色体或Contig的ID或编号、DNA的正负链信息以及在染色体上的起始和终止位置数值。两种文件的区别在于,BED文件中起始坐标为0,结束坐标至少是1,GFF中起始坐标是1而结束坐标至少是1。把BED转成对应的GFF格式(仅保留两者相同信息)