基因融合是自然选择的结果吗
发布网友
发布时间:2023-05-04 22:31
我来回答
共2个回答
热心网友
时间:2023-11-05 19:20
不是的,腾讯技术洞察,尽在腾讯云开发者公众号
前往关注
登录
首页
学习
实践
活动
专区
工具
TVP
返回腾讯云官网
全栈程序员站长
55.1K 篇文章
关注
一文搞懂基因融合(gene fusion)的定义、产生机制及鉴定方法[通俗易懂]
2022-09-20 19:08:59阅读 2530
大家好,又见面了,我是你们的朋友全栈君。
【基因融合的定义】
基因融合(gene fusion)是指由于某种机制(如基因组变异)使得两个不同基因的部分序列或全部序列融合到一起,形成了一个新的基因。如下图所示:
基因融合示意图(图片来源:https://www.tumorfusions.org/)
一般来说,基因融合是指基因组层面的融合。但转录组层面也可能发生融合,主要是由于两个不同基因转录产生的RNA,由于某种原因融合在了一起,形成新的融合RNA,该RNA可能编码蛋白,也可能为非编码。而基因组层面产生的融合基因,根据融合的情况,可能表达,也可能不表达(如破坏了启动子区域或其他原因)。
【基因融合的产生机制】
基因融合的产生机制主要有以下三种,具体如下图所示:
基因融合常见的三种发生机制(图片来源:Wikipedia)
基因融合常见的三种发生机制:
1)Chromosomal Translocation,染色体易位。如上图A中1号和2号染色体上的两片段发生交叉互换,导致1号染色体上的浅绿色基因与2号染色体上的橘*基因融合到一起;
2)Interstitial deletion,中间缺失。如上图中,3号染色体上的橘*基因和浅绿色基因之间的区段发生缺失(deletion),最终导致这两个基因融合到了一起;
3)Chromosomal Inversion,染色体倒位。如4号染色体上的橘*基因到墨绿色基因之间的片段发生倒位,最终导致橘*基因和浅绿色基因融合到了一起。
【基因融合与癌症的关系】
那为什么要研究基因融合呢?因为过去的诸多研究不断表明,基因融合与各种疾病,特别是癌症的发生发展紧密相关,甚至是一些癌症的直接诱因,所以基因融合也成为了当前组学大数据分析中的一项重要研究内容。
目前,已经报道有很多癌症的发生与基因融合密切相关,具体如下表所示:
已知的一些肿瘤中的基因融合数量和复发融合数量 (图片来源:Mertens et al. Nature Reviews Cancer, 2015)
而且,美国FDA(Food and Drug Administration)已经批准了一些针对特定基因融合的药物,以治疗相应的癌症,具体如下表所示:
FDA已批准的治疗相应肿瘤的药物 ( 图片来源:Mertens et al. Nature Reviews Cancer, 2015)
因此,基因融合可能与各种癌症的发生发展紧密相关,这些融合基因还可能是潜在的药物靶点,非常有必要对它们进行深入的研究。
【基于全基因组测序和转录组测序鉴定基因融合】
基因融合的鉴定,可以基于全基因组测序数据(whole-genome sequencing,WGS),也可以利用转录组测序数据(RNA-seq),或者二种技术结合起来更好。
全基因组测序鉴定出的基因融合,基本能确定是由于基因组层面发生某种变异而引起的,但如果没有转录组测序数据,就无法准确判断融合后产生的新基因是否能够表达,或表达量的高低。
而转录组测序数据鉴定出的基因融合,可以明确是能表达的基因融合,但却无法完全确定是否是由基因组变异产生的,还是来源于两个不同基因转录后发生的RNA融合。
因此,如果条件允许,同时结合全基因组测序和转录组测序来鉴定基因融合,能够获得更准确的鉴定结果。
【基因融合鉴定中的常见术语】
在了解基因融合鉴定的方法或软件前,我们先了解一下基于测序数据鉴定基因融合时的一些常见术语。具体如下图所示:
基因融合鉴定的一些常见术语(图片来源:Liu et al. Nucleic Acids Research, 2016)(A) Intact exon (IE) type andbroken exon (BE) type fusion transcripts; (B) spanning read, split readand anchor length; (C) short and long insert size of DNA fragment forsequencing.
这些常见的术语有:
1)Intact exon (IE) type fusion,是指融合后完整的保留了原来的外显子,未影响原来的外显子结构。如上图A中Gene A的Exon2和Gene B的Exon1融合后完整的保留了两个外显子的序列;
2)Broken exon (BE) type fusion,是指融合后没有保留原来完整的外显子序列。如上图A中 Gene A的Exon3的部分序列和Gene B的Exon2融合在一起,融合后的新基因中,来自Gene A的Exon3丢失了部分序列;
3)Breakpoint,是指两个融合基因在基因组上发生融合的位置,如上图B中Gene A(蓝色)和Gene B(绿色)融合的位点;
4)Spanning read,是指跨越融合位点分别匹配到两个融合基因的paired-end read,比如上图B中的匹配到Gene A(蓝色)和Gene B(绿色)的一对read;
5)Split read,是指恰好匹配到融合位点上的read,具体如上图B中右侧图所示;
6)Anchor length,是指跨越融合位点的read左端和右端的长度,具体如上图B中右侧图所示;
7)short insert size,一般是指双端测序paired-end sequencing中,两个read中间间隔的较短距离,一般为几百bp;
8)long insert size,一般是指双端测序mate-pair sequencing中,两个read中间间隔的较长距离,一般为几kb甚至更长;
基因融合鉴定软件的开发,一般就是基于上面提到的这些术语,采用相应的算法来设计的。
【基因融合鉴定软件的性能比较】
到目前为止,已经有数十种不同的基因融合检测软件相继被开发出来,其中一些具有比较好的综合性能。接下来,我们就进一步比较分析一下一些常用的基因融合鉴定软件的性能。
下表列出了15种常用的基因融合鉴定软件在3组不同类型的人工合成数据和3组真实数据集上的性能比较。这些软件分别是:SOAPfuse,FusionCatcher,JAFFA,EricScript,chimerascan,PRADA,deFuse,FusionMap,TopHat-Fusion,MapSplice,BreakFusion,SnowShoes-FTD,FusionQ,FusionHunter,ShortFuse。
15种基因融合鉴定软件在3组合成数据和3组真实数据上的F-measure得分比较(图片来源:Liu et al. Nucleic Acids Research, 2016)。F-measure是一种统计量,又称为F-Score,是Precision和Recall加权调和平均,常用于评价分类模型的好坏,数值越高代表性能越好 注:* 综合表现最好。
值得注意的是,测序read的长度,还有双端测序read的间隔距离insert size等都会影响基因融合的鉴定效果。因此,上面表中使用了不同类型的测数据来综合检验这15款软件的性能。其中,Type-1A 为使用wgsim软件人工合成 的来自5’ 和 3’ end 的chimerical transcripts 双端测序数据, 其中read长度为100bp,insert size 为500 ± 50 bp; Type-1B数据合成方法和Type-1A类似,只是双端测序数据的insert size较小,为 250 ± 50 bp;Type-3B: read 长度为50 bp 的合成数据; 另外三组真实数据分别来自于Breast cancer,Melanoma和Prostate cancer。
比较结果显示,SOAPfuse,FusionCatcher和JAFFA在3组模拟数据和3组真实数据上的综合性能最好,取得了最高的F-measure分值。
Liu et al. 进一步比较了15种基因融合检测软件在更多真实数据上的性能表现。具体如下图所示:
15种基因融合检测软件在真实测序数据集上的进一步性能比较(图片来源: Liu et al. Nucleic Acids Research, 2016 )。A到C纵轴为检测到的真实基因融合数量,横轴为15种不同的软件。D图为Precision和Recall的曲线比较。其中(A) 和(D)使用的是 Breast cancer数据集; (B) 和 (E) 使用的是Melanoma数据集; (C) 和(F)使用的是Prostate cancer数据集。
真实数据上的比较结果也显示,SOAPfuse,FusionCatcher和JAFFA在检测基因融合时具有较高的准确性。
Liu et al. 也比较了15种基因融合检测软件在不同测序深度的合成数据集和真实数据集上的运行时间比较。具体如下图所示:
15种基因融合检测软件的运行速度比较(图片来源: Liu et al. Nucleic Acids Research, 2016 )。Y轴为运行时间分钟(min)。A为 合成数据集,read长度为100 bp,模拟测序深度分别为50X, 100X 和200X。B为真实的prostate cancer 171T 的数据集。
运行时间比较结果显示,FusionMap等软件的运行速度最快。但前面的结果显示,FusionMap检测的基因融合准确性较低。
所以,没有哪一个方法在各方面的性能比较上面都具有最明显的优势。整体来看,SOAPfuse综合比较最好,接着是FusionCatcher和JAFFA。 而且,因为不同软件具有的优缺点不一样,如果联合多个不同软件一起鉴定基因融合,或可取得更准确的结果。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/166940.html原文链接:https://javaforall.cn
本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!
本文分享自作者个人站点/博客
复制
如有侵权,请联系 cloudcommunity@tencent.com 删除。
sql
文章来自专栏
全栈程序员必看
55.1K 篇文章267 人关注
订阅
评论 (0)
写评论
暂无人发表评论
相关文章
转录组高级分析之融合基因
2017年BMC文章:De novo assembly and characterization of breast cancer transcriptomes...
长读长单分子实时测序揭示食管鳞状细胞转录组的异质性和复杂性
果然,坚持真的好难,我现在都想不通我是如何坚持七八年每日写笔记做分享,积累着1.3万篇教程的?
59匹马的8个组织的长非编码RNA的鉴定
标题:Identification of long non-coding RNA in the horse transcriptome
【Nature communications】四篇好文简读-专题12
A universal deep neural network for in-depth cleaning of single-cell RNA-Seq dat...
差异共表达网络-Co-expression networks
第一步,基于每对基因间的相关性或相互信息定义每2个基因之间的个体关系。这些关系描述了所有样本中基因对表达模式之间的相似性。不同的相关性方法已经被用了构建网络,包...
【连载】癌症中的嵌合RNA (Chimeric RNA) (二)
癌症基因组项目中的米特曼染色体畸变数据库和基因融合数据库等数据库发现了大量在癌症中出现的嵌合RNA。通过癌症基因组图谱计划(TCGA)这样的大型联盟的努力,积累...
处理单细胞? Bioconctor就够用了
能看这本书的都是对单细胞测序有所需求或这有这个意愿去学习相关知识的。这本书主要是整合目前常见的单细胞分析流程并尽可能详细的解释这些流程的每一个步骤,包括原理,所...
这篇发在Nature上的泛癌RNA alterations能给我们带来哪些思考?
今天跟大家分享的是2020年2月发表在Nature(IF:43.07)杂志上的一篇文章“Genomic basis for RNA altera...
AnimalTFDB 3.0 | 动物转录因子注释和预测的综合资源库
转录因子(Transcription factor,TF)是一类能够以序列特异性方式结合DNA并对基因转录起关键*作用的蛋白质,在各种生物过程和疾病发生中起非...
9个组织的37个样本的大豆的长非编码RNA的鉴定
标题:The Long Intergenic Noncoding RNA (LincRNA) Landscape of the Soybean Genome
转录组讲师带你读文献(6)-散发性甲状腺髓样癌的基因组和转录特征
我在我在04-转录组笔记推文任务列表(半年期)里面安排了6个经典综述和10篇转录组应用文献给大家,可惜愿意沉下心了认真苦学的并不多。(https://share...
高原牦牛的长非编码RNA的鉴定
摘要:耗牛被誉为“高原之船”,经过几千年的进化和低氧强紫外线的残酷环境选择,适应了高原环境,为青藏高原人民提供了重要的物资。本研究旨在寻找牦牛高原适应过程中差异...
生物信息学入门必须了解的名词
生物信息学(bioinformatics):综合计算机科学、信息技术和数学的理论和方法来研究生物信息的交叉学科。包括生物学数据的研究、存档、显示、处理和模拟,基...
【连载】癌症中的嵌合RNA (Chimeric RNA):背景及分类
https://doi.org/10.1016/bs.acc.2020.04.001
【连载】癌症中的嵌合RNA (Chimeric RNA) (一)
嵌合RNA是包含两个独立基因的外显子杂交的转录物。传统观点认为嵌合RNA是由染色体重排引起的基因融合而来。这些典型的嵌合RNA被描述为具有癌症特异性表达模式和/...
ToppGene Suite中文使用指南
2007.12:Improved human disease candidate gene prioritization using mouse phenoty...
转录组讲师带你读文献-m6A和RNA测序结合
我在我在04-转录组笔记推文任务列表(半年期)里面安排了6个经典综述和10篇转录组应用文献给大家,可惜愿意沉下心了认真苦学的并不多。(https://share...
CircRNA-seq上游分析工具测评:CIRIquant VS. CIRCexplorer3
本次测评CircRNA-seq上游分析的两大最新工具CIRCexplorer3及CIRIquant。CIRCexplorer3是2019年发表在Genomics...
更多文章
社区活动
腾讯云 x ES 有奖征文
参与活动,赢取限量周边礼品
邀请好友加入自媒体分享计划
邀请好友,同享奖励 30 / 100 / 180 元云服务器代金券
Copyright © 2013-2023
Tencent Cloud. All Rights Reserved.
腾讯云 版权所有
点赞
1
评论
0
热心网友
时间:2023-11-05 19:21
基因融合并不是自然选择的结果。基因融合是指每个个体的基因来自父母双方,在生殖时将两个不同基因的DNA重组,形成新的基因组合。而自然选择是基于对生物体适应环境和生存繁殖能力的选择,能带来遗传信息的传递。尽管基因融合是影响遗传变异的重要因素之一,但它本身并不代表生物体是否存活和成功繁衍。自然选择是通过适应性变异的积累,逐步地改变整个种群的遗传构成。这些适应性变异在每个生物的基因组中都是独立进行的,因此它们不是由基因融合产生的。