已知部分基因序列,如何获得全长基因?

发布网友发布时间：2022-04-23 12:54

共4个回答

热心网友时间：2023-08-16 06:04

基因是遗传物质基本的功能单位，分离和克隆目的基因是研究基因结构、揭示基因功能及表达的基础，因此，克隆某个功能基因是生物工程及分子生物学研究的一个重点。经典克隆未知基因的方法比如通过筛选文库等有个共同的弊病, 即实验操作繁琐, 周期较长、工作量繁重,且不易得到全长序列。又由于在不同植物中目的基因mRNA丰度不同，所以获得目的基因的难易程度又不一样，特别是对于丰度比较低的目的基因即使使用不用的方法也不一定能获得成功。近年来随着PCR技术的快速发展和成熟.已经有多种方法可以获得基因的全长序列, 比如经典的RACE技术，染色体步移法和同源克隆法等，本文主要综述几种重要的克隆方法的原理和运用，并且比较分析这几种方法的优缺点，为你的实验节约时间和成本。
　　1. RACE技术
　　 1985年由美国PE-Cetus公司的科学家Mulis等[1]发明的PCR技术使生命科学得到了飞跃性的发展。1988年Frohman等[2] 在PCR技术的基础上发明了一项新技术, 即cDNA末端快速扩增技术( rapid amplification of cDNA ends, RACE), 其实质是长距PCR( long distance, PCR)。通过PCR由已知的部分cDNA 序列, 获得5′端和3′端完整的cDNA, 该方法也被称为锚定PCR ( anchored PCR) [3] 和单边PCR( one-sidePCR) [4]。RACE技术又分为3’RACE和5’端RACE。3′RACE 的原理是利用mRNA 的3′端天然的poly(A) 尾巴作为一个引物结合位点进行PCR, 以Oligo( dT) 和一个接头组成的接头引物( adaptor primer, AP)反转录mRNA得到加接头的第一链cDNA。然后用一个正向的基因特异性引物( gene-specific primer, GSP) 和一个含有接头序列的引物分别与已知序列区和poly(A) 尾区退火, 经PCR扩增位于已知序列区域和poly( A) 尾区之间的未知序列，若为了防止非特异性条带的产生, 可采用巢式引物( nested primer) 进行第二轮扩增, 即巢式PCR( nested PCR) [5，6]。5’RACE跟3’RACE原理基本一样，但是相对于3’RACE来说难度较大。
　　5'-RACE受到诸多因素的影响而常常不能获取全长，因此研究者都着手改进它。这些措施主要是通过逆转录酶、5'接头引物等的改变来实现的，因此出现了包括基于“模板跳转反转录”的SMART RACE技术( switching mechanism at 5′ end of RNA transcript) [7] , 基于5′脱帽和RNA酶连接技术的RLM-RACE技术(RNA ligase mediated RACE)[8], 利用RNA连接酶为cDNA第一链接上寡聚核苷酸接头的SLC RACE技术(single strand ligation to single-stranded cDNA)[9] , 以及以内部环化的cDNA第一链为模板进行扩增的自连接或环化RACE技术(self-ligation RACE or circular RACE)[10]，和通过末端脱氧核苷酸转移酶( TdT)加尾后引入锚定引物的锚定RACE技术( anchored RACE)[11]。
　　1.1基于‘模板跳转’的SMART RACE技术
　　SMART-RACE技术的最大特点是5′ RACE过程中的“模板跳转”现象,即当反转录进行到mRNA模板的5′末端时,反转录酶表现出末端转移酶活性,在第一链cDNA的3′端加上3-5 个残基(主要是dC) ,随后第一链cDNA与3′端含几个dG的寡核苷酸引物退火,使反转录反应发生跳移,以引物中寡核苷酸为模板继续进行,最终反转录所得产物必然包含完整的mRNA5′末端序列及引物序列,可直接用于RACE-PCR获得完整地5′ cDNA末端。由于上述过程无需接头连接,而且直接以第一链cDNA作为模板进行RACE-PCR ,因此更加简便、快捷。另外,SMART -RACE还采用了降落PCR、抑制PCR、LD - PCR 等先进扩增技术,提高了PCR扩增的敏感性和真实性,降低了非特异的产物背景,因此该技术已被广泛应用于cDNA末端快速扩增,尤其是5’端的克隆。
　　1.2末端脱氧核苷酸转移酶( TdT)加尾技术
　　传统的5′RACE反应是以TdT对第一链cDNA进行同聚物加尾来引发第二链cDNA的合成[12] ,这种方法经常会导致RACE反应失败或产生一些副产品。其主要原因是同聚物加尾反应难以控制,TdT 加尾时不能区分cDNA是否是全长,非全长cDNA分子被加尾后将在随后的PCR反应中得到优先扩增,从而产生大量的非特异性产物背景，并且TDT的加尾效率比较低[13]。目前许多研究这对其进行了改进。
　　夏瑞等[11]提出了一种改良的TDT加尾克隆基因5’端的方法。其首先用1个15 bp左右的特异反转录引物代替通用反转录引物Olig( dT) n对模板cDNA进行初步筛选,使合成的cDNA更靠近目的基因的5′端。其次, 两个上游引物采取巢式策略取代一般的poly( dG)n或poly ( dC)n，从而控制第二轮PCR的退火温度, 保证扩增的特异性。并且在PCR过程中采用了如锚定PCR、巢式PCR、降落PCR等方法增加扩展产物的特异性。这些新的改进使得到目的条带的概论增加，并且反转录引物不需要磷酸化, 从而大大节约实验成本。
　　2.染色体步移法
　　染色体步行(chromosome walking)是指由生物基因组或基因组文库中的已知序列出发逐步探知其旁邻的未知序列或与已知序列呈线性关系的目的序列核苷酸组成的方法和过程14]。对于基因组测序已经完成的少数物种(水稻、拟南芥等)来说，可以轻松地从数据库中找到已知序列的侧翼序列。但是这毕竟只是研究少数模式植物时的情况，对于自然界中种类繁多的其植物而言，在不知道它们的基因组DNA序列以前，想要知道一个已知区域两侧的DNA序列，只能采用染色体步移技术。因而，染色体步移技术在现代分子生物学研究中占有举足轻重的地位，是结构基因组研究以及功能基因组研究的基础。
　　目前,分离侧翼序列的染色体步移方法主要有两种,一是结合基因组文库为主要手段的染色体步移技术,构建基因组文库进行染色体步移尽管步骤比较繁琐,但是适于长距离步移,可以获得代表某一特定染色体的较长连续区段的重叠基因组克隆群。随着亚克隆文库条件构建条件的优化及测序技术的进步,这种方法也将更加快捷,准确。另一个是基于PCR扩增为主要手段的染色体步移技术。基于PCR扩增为主要手段的染色体步移技术步移距离相对较短,但是操作比较简单,尤其适合于已知一段核苷酸序列的情况下进行的染色体步移。反向PCR、外源接头介导PCR和热不对称交错PCR(TAIl-PCR)等就是建立在PCR技术基础上的染色体步行技术，为扩增已知序列旁侧的未知DN*段提供了捷径．这些方法的建立可以不必经过烦琐的建库和筛选过程而获得全长基因序列．
　　2.1连接介导PCR
　　连接介导聚合酶链反应是以连接反应为基础的单侧PCR技术，首先通过基因组DNA酶切，在酶切后的DN*段的一端连接上一个公共连接子，而后用这个连接子为引物与另一个基因特异引物进行扩增，得到了包含连接子在内的基因序列。连接介导PCR又分为连接载体的PCR、连接单链接头的PCR和连接双链接头PCR。此方法原理简单,操作方便。
　　2.1.1连接载体的PCR
　连接载体的PCR是利用已知基因组DNA序列设计的特异引物和载体通用引物进行扩增获得目的片段的一项PCR技术。操作方法是首先用内切酶酶切基因组DNA和载体质粒DNA，得到小片段DNA和线形字体序列，然后用T4连接酶把载体序列与DNA小片段相连接，以连接产物为模板，以一个基因特异引物和载体引物进行扩展，通过克隆测序得到未知的侧翼序列。
　　2.1.2连接单链接头的PCR
　　连接单链接头的PCR又叫锅柄PCR，是连接单链接头PCR的典型代表,因其以一个类似锅柄结构的DNA分子为模板而得名[18]。其基本原理是：将基因组总DNA 用能产生5' 端突出末端的内切酶切割；接着连上一条单链的寡核苷酸，其具有两个特点，其一是5'端和*性片段的突出末端互补，其二是除此以外的序列必须和已知序列中一段完全同源；在PCR 的复性阶段，外源接头就会和其链内同源序列配对而成一个末端部分封闭的分子内环状结构，在TaqDNA 聚合酶的作用下，沿着3' 端将单链部分完全补平后而形成一个锅柄结构，因此这种方法也被称为锅柄PCR。由于其末端是一个反向重复序列，故最后只需一条引物即可完成对目标区段的扩增。
　　2.1.3连接双链接头PCR
　　双链接头法也称为adapter介导的PCR法[ 19，20]。其主要过程为首先用能够产生粘性末端的*性内切酶消化基因组DNA,然后将末端配对的接头和*性片段连接,以其作模板,用接头引物和已知序列特异引物进行PCR扩增,即可获得包含侧翼序列的目标片段。显然，这类方法存在一个问题：即如何抑制接头到接头的非目标扩增。因此许多研究者由对其进行了改进，出现了抑制PCR，多功能接头PCR和T接头PCR[21]。
　　2.2热不对称交错PCR(TAIl-PCR)
　　热不对称性PCR (thermal asymmetric interlaced PCR, TAIL-PCR)就是建立在PCR技术基础上的染色体步移技术，为扩增已知序列旁侧的未知DNA 片段提供了捷径。该技术由Liu和Whitter于1995年首先研究并报道[22]。以基因组DNA为模板，使用高退火温度的长特异引物和短的低退火温度的简并引物，通过特殊的热不对称(高严谨性PCR和低严谨性PCR交替)循环程序，有效扩增特异产物。该技术具有简单快速、特异性高、分离出的DNA 序列可以用于图位克隆、遗传图谱绘制和直接测序等优点，近年来，被分子生物学研究者广泛应用，成为分子生物学研究中非常实用的基因侧翼序列克隆技术，同时在植物基因克隆方面也取得了很大进展。
　　TAIL-PCR技术的基本原理是利用目标序列旁的已知序列设计3个嵌套的特异性引物(special prime ,简称sp1 ,sp2 ,sp3 ,约20 bp) ,用它们分别和1个具有低Tm值的短的(14 bp) 随机简并引物(Arbitrary degenerate prime 简称AD)相组合,以基因组DNA作为模板,根据引物的长短和特异性的差异设计不对称的温度循环,通过分级反应来扩增特异引物。
　　TAIL-PCR包括3轮PCR反应。第1轮PCR反应包括5次高严谨性反应、1次低严谨性反应、10次较低严谨性反应和12次热不对称的超级循环。首先5次高严谨性的反应，使长的高退火温度的特异引物SPl与已知的序列退火并延伸，目标序列扩增成直线性型上升，由AD引物结合产生的非特异性产物的浓度则较低。而后进行1次低退火温度的反应，目的是使简并引物结合到较多的目标序列上，接下来10次较低严谨性的反应可以使两种引物均能与模板退火，从而使原来由高严谨性循环所产生的单链靶DNA复制成双链DNA，为下一轮线性扩增模板做准备。最后是进行12次热不对称的TAIL循环(超级循环即高特异性和低特异性循环交替)，目的片段得以指数性地扩增，扩增的量大大超过了非目标片段。经过上述一系列的反应得到了不同浓度的3种类型产物：TAIL-PCR中间会出现3 种类型的产物。类型1是特异引物和任意引物之间扩增的产物（即目标产物；类型2是单独由特异引物扩增的产物；类型3是单独由任意引物引发的产物。该方法由3步连续的PCR扩增过程构成。经过第一阶段的PCR扩增后，类型2产物的分子数目在3种产物中最多，类型1产物稍低。在第二阶段的扩增中，类型1产物的分子数逐渐升至最高，类型2分子数目基本保持不变，而类型3的分子数目仍然保持很低。在第三阶段结束后，基本上只有类型1产物，即目的产物。
　　TAIL-PCR的技术难点，首先是引物设计，和一般的PCR反应相比，TAIL-PCR反应对引物的要求较高，引物的设计很是重要。特异性引物和简并引物的选择直接影响扩增的效果。特异引物设计：3个嵌套的特异性引物长度一般在20~30 bp之间，Tm 值一般设为58~68℃。SP1、SP2 和SP3之间最好相距100 bp以上以便在电泳时更容易区分3轮PCR产物。简并引物是按照物种普遍存在的蛋白质的保守氨基酸序列设计的，相对较短，长度一般是14 bp左右，Tm值介于30~48℃之间。AD引物是否最佳与它的简并度、引物长度和核苷酸序列组成有很大关系。
　　目前一些研究这又对TAIL-PCR进行了该进，比如省去了10个中等严谨度的PCR循环，3次PCR循环中的变性时间由5 s延长到了30 s,更有利于DNA彻底解链，第3次循环增加了热不对称交织PCR,更有利于特异目的片段的富集，把较低特异性反应的温度从44℃降到29℃等，以利于更好的扩增目的片段。
　　3 .RACE技术与染色体步移方的比较
　　3.1 SMART-RACE与末端脱氧核苷酸转移酶( TdT)加尾技术的比较
　　 SMART-RACE技术是目前一种比较成熟的技术，它能够最大限度地提高在反转录反应中获取全长cDNA的可能，成功率高，可以节约时间并且操作程序简单，但是于价格过于昂贵, 试验成本增加, 而且对RNA质量要求很高。TdT加尾扩增法的优化改良, 成功率和稳定性都得到较大的提高，改良的TdT末端加尾扩增法综合了多项PCR扩增方法如锚定PCR、巢式PCR、降落PCR等, 原理简单易懂, 操作性强，能够满足一般基因克隆的要求。
　　3.2连接介导PCR与TAIL-PCR的比较
　　连接介导PCR原理简单，但其需要DNA内酶切酶切，而内酶切又比较昂贵，增加实验的成本。并且酶切的好坏，接头处理方法是否得当而影响接头与DNA小片段的连接效率，从而导致失败。TAIL-PCR不需要进行DNA酶切而直接用DNA做模板进行扩增，仅仅只需要三轮PCR扩增，就可以得到目的条带。简单、特异性高、高灵敏度、快速、不涉及连接反应这就是TAIL-PCR的优点，但是TAIL-PCR也有缺点，主要是TAIL-PCR 反应需要较多的引物组合。此外,由于AD引物存在有限的结合位点,对于个别的侧翼序列,即使使用不同的简并引物也难以扩增到阳性结果。目前已经有学者提出用RAPD的引物替代AD引物的观点，由于RAPD引物数量很多，所以可以解决AD引物存在有限的结合位点的不足。
　　4.总结
　　 RACE是一种快速、有效的克隆基因全长cDNA的有效方法。基因的3’端通过RACE技术非常容易得到，但是5’端却比较难，即使用比较昂贵的5’端RACE试剂盒也不一定能得结果。而基于PCR扩增的染色体步移法，却有得天独厚的优势，它不仅仅能用于基因全长的获得而且还可以得到基因5’端的启动子序列。模板仅仅只要基因组DNA就行，原理简单易懂，操作方法也简单易行，并且非常的廉价，适用于不同水平和不同层次的研究者。笔者通过TAIL-PCR技术成功得到了芒果LFY基因的全长及其启动子序列。

热心网友时间：2023-08-16 06:04

这是我们生物信息学中经常遇到的问题,最常用的方式就是就是到数据库--美国国立生物技术信息中心(NCBI)的GenBank--中用在线版的局部比对基本查询工具(Basic Local Alignment Search Tool,BLAST)搜索全基因组,下面是在线软件的网页链接:
http://www.ncbi.nlm.nih.gov/blast/Blast.cgi?PROGRAM=blastn&BLAST_PROGRAMS=megaBlast&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LOC=blasthome
(有时候百度会把链接屏蔽掉,那么就在谷歌中找NCBI,进入后在右边那一栏最下面有BLAST,点击进入,选择Basic BLAST中的nucleotide blast就可以到软件页面了)
把已知的基因序列贴入查询框,点击按钮"BLAST"追问您能详细点说明吗？谢谢！

追答是没有进入BLAST页面?还是软件具体操作不了解?
进入BLAST页面的方法如上已详诉,软件操作详细步骤如下:
1.在"Enter Query Sequence"下面的输入框中贴入你已知的基因序列,如GTGCCGTGACTCGGATCGGGGGACCTCCCTTGGGAGATCAATCCCCCATCCTCCTGCT
(不要过于太短,一般几十到几百nt);
2.设置参数:一般选一下"Choose Search Set"下的要搜索的数据库(Database),根据你的序列的物种和其他信息;其他默认.如果搜不到结果再试着改一下其他参数;
3.点击最下面的按钮"BLAST" .
(我已经尽力了,具体细节还要靠你自己,希望对你有帮助!)

热心网友时间：2023-08-16 06:05

如果是单链。可根据碱基互补配对原则
如果知道其编码的氨基酸序列，找到密码子，再根据rna逆转录得，只是这样不唯一
不过我在怀疑，这是不是一道高中题
好像条件不足追问谢谢！不过这不是高中题了，我需要NCBI的详细过程！

追答囧了，我也觉得不是，不好意思

热心网友时间：2023-08-16 06:05

3'和5‘RACE追问RACE和NCBI的blast可以有什么联系啊？谢谢

追答利用这段已知的不完整基因序列，可以在NCBI上BLAST找到其他物种这个基因的全长，找几个近源种的下载下来，用DNAMAN等一些序列分析软件比对找到这些序列的共有保守区，在这个位置设计引物，采用RACE技术获得已知序列上下游的序列，到足够长后，再参考其余物种的这个基因全长，如果相似性非常高，就可以说是得到了这个物种中这个基因的全长了。