DNA测序的方法有很多种. 目前最常见的是双脱氧终止法了. 在测序用的缓冲液中含有四种dNTP及聚合酶. 测序时分成四个反应, 每个反应除上述成分外分别加入2,3-双脱氧的A, C, G, T核苷三磷酸(称为ddATP, ddCTP, ddGTP, ddTTP), 然后进行聚合反应. 在第一个反应物中, ddATP会随机地代替dATP参加反应一旦ddATP加入了新合成的DNA链, 由于其3位的羟基变成了氢, 所以不能继续延伸. 所以第一个反应中所产生的DNA链都是到A就终止了; 同理第二个反应产生的都是以C结尾的; 第三个反应的都以G结尾, 第四个反应的都以T结尾, 电泳后就可以读出序列了. 也许这样说你不一定明白. 举一个例子, 假如有一个DNA, 互补序列是GATCCGAT, 我们试着做一下: 在第一个反应中由于含有dNTP+ddATP, 所以遇到G, T, C三个碱基时没什么问题, 但遇到A时, 掺入的可能是dATP或ddATP, 比如已合成到G, 下一个如果参与反应的是ddATP则终止, 产生一个仅有2个核苷酸的序列: GA, 否则继续延伸, 可以产生序列GATCCG, 又到了下一个A了. 同样有两种情况, 如果是ddATP掺入, 则产生的序列是GATCCGA, 延伸终止, 否则可以继续延伸, 产生GATCCGAT. 所以在第一个反应系统中产生的都是以A结尾的片段: GA, GATCCGA, 同理在第二个反应中产生的都是以C结尾的片段: GATC, GATCC, 在第三个反应中产生的都是以G结尾的片段: G, GATCCG 在第四个反应中产生的都是以T结尾的片段: GAT, GATCCGAT, 电泳时按分子量大小排列, A反应的片段长度为2, 7; C反应的为4, 5; G反应的为1, 6; T反应的为3, 8, 四个反应的产物分别电泳, 结果为8 7 6 5 4 3 2 1 A | | C | | G | | T | | 我们可以从右向左读, 为GATCCGAT, 至此, 测序完成(上面这个图在百度知道中显示不正常, 因为百度知道的网页用的是比例字体, 你如果想看它, 拷贝到记事本中, 用等宽的字体来看).
1 cDNA 文库的构建1.1 cDNA 文库构建的基本原理与方法 cDNA 文库是指某生物某发育时期所转录的全部 mRNA 经反转录形成的 cDNA 片段与某种载体连接而形成的克隆的集合。经典 cDNA 文库构建的基本原理是用 Oligo(dT) 作逆转录引物,或者用随机引物,给所合成的 cDNA 加上适当的连接接头,连接到适当的载体中获得文库。其基本步骤包括:RNA 的提取(例如异硫氰酸胍法,盐酸胍—有机溶剂法,热酚法等等,提取方法的选择主要根据不同的样品而定),要构建一个高质量的 cDNA 文库,获得高质量的 mRNA 是至关重要的,所以处理 mRNA 样品时必须仔细小心。由于 RNA 酶存在所有的生物中,并且能抵抗诸如煮沸这样的物理环境,因此建立一个无 RNA 酶的环境对于制备优质 RNA 很重要。在获得高质量的 mRNA 后,用反转录酶 Oligo(dT) 引导下合成 cDNA 第1链, cDNA 第2链的合成(用 RNA 酶 H 和大肠杆菌 DNA 聚合酶 I,同时包括使用 T4 噬菌体多核苷酸酶和大肠杆菌 DNA 连接酶进行的修复反应),合成接头的加入、将双链 DNA 克隆到载体中去、分析 cDNA 插入片断,扩增 cDNA 文库、对建立的 cDNA 文库进行鉴定。这里强调的是对载体的选择,常规用的是 λ 噬菌体,这是因为 λ DNA 两端具有由12个核苷酸的粘性末端,可用来构建柯斯质粒,这种质粒能容纳大片段的外源 DNA。1.2 cDNA 全长文库 经典 cDNA 文库的构建虽然高效、简便,但文库克隆的片段一般较小,单个克隆上的 DNA 片段太短,所能提供的基因信息很少,大多需要几个克隆才能覆盖一个完整的全基因的 cDNA。为了克隆到真正的 cDNA 全长,建立富含全长的 cDNA 文库具有重要意义。为此,必须克服仅用 mRNA 的 PolyA 尾合成以及由普通逆转录酶作用特点所导致的局限性。全长 cDNA 文库,是指从生物体内一套完整的 mRNA 分子经反转录而得到的 DNA 分子群体,是 mRNA 分子群的一个完整的拷贝。全长 cDNA 文库不仅能提供完整的 mRNA 信息,而且可以通过基因序列比对得到 mRNA 剪接信息,此外,还可以对蛋白质序列进行预测及进行体外表达和通过反向遗传学研究基因的功能等。目前所报道的对全长文库的构建一般按照美国 CLONTECH 公司的 SMART cDNA Library Construction Kit 方法或 GeneRacer 试剂盒 (Invitrogen,USA) 使用说明进行。判断一个 cDNA 文库中的 cDNA 序列是否是全长基因的 cDNA,主要方法有以下几种。1.2.1 直接从序列上评价 5'端:如果有同源全长基因的比较,可以通过与其它生物已知的对应基因5'末端进行比较来判断。如果无同源基因的新基因,则首先判断编码框架是否完整,即在开放阅读框的第1个 ATG 上游有无同框架的终止密码子;其次,判断是否有转录起始点,一般加在5'帽结构后有一段富含嘧啶的区域,或者是 cDNA 5'序列与基因组序列中经过酶切保护的部分相同,则可以确定得到的 cDNA 的5'端是完整的。3'端:同样可以用其它生物已知的对应基因3'末端进行比较来判断,或编码框架的下游有终止密码子,或有1个以上的 PolyA 加尾信号,或无明显加尾信号的则也有 PolyA 尾。1.2.2 用实验方法证实 可以通过引物延伸法确定5'端和3'端的长度,如:5'端 RACE,3'端 RACE,或者通过 Northern Blot 证实大小是否一致。1.3 对 cDNA 文库的分析 对 cDNA 文库质量的评价主要有两个方面。第一方面为文库的代表性,cDNA 文库的代表性是指文库中包含的重组 cDNA 分子反映来源细胞中表达信息(即 mRNA 种类)的完整性,它是体现文库质量的最重要指标。文库的代表性好坏可用文库的库容量来衡量,它是指构建的原始 cDNA 文库中所包含的独立的重组子克隆数。库容量取决于来源细胞中表达出的 mRNA 种类和每种 mRNA 序列的拷贝数,1个正常细胞含10000~30000种不同的 mRNA,按丰度可分为低丰度、中丰度和高丰度三种,其中低丰度 mRNA 是指某一种在细胞总计数群中所占比例少于0.5%时。满足最低要求的 cDNA 文库的库容量可以用 Clack-Carbor 公式 N=Ln(1-P)/(1-1/n) 计算( P 为文库中任何一种 mRNA 序列信息的概率,通常设为99%;N 为文库中以 P 概率出现细胞中任何一种 mRNA 序列理论上应具有的最少重组子克隆数;n 为细胞中最稀少的 mRNA 序列的拷贝数;
第二方面是重组 cDNA 片段的序列完整性。在细胞中表达出的各种 mRNA 片段的序列完整性。在细胞中表达出的各种 mRNA 尽管具体序列不同,但基本上都是由3部分组成,即5'端非翻译区,中间的编码区和3'端非翻译区。非翻译区的序列特征对基因的表达具有重要的调控作用,编码序列则是合成基因产物—蛋白质模板。因此,要从文库中分离获得目的基因完整的序列和功能信息,要求文库中的重组 cDNA 片段足够长以便尽可能地反应出天然基因的结构。2 cDNA 文库构建的其它类型2.1 均一化 cDNA 文库 它是指某一特定组织或细胞的所有表达基因均包含其中,且在 cDNA 文库中表达基因对应的 cDNA 的拷贝数相等或接近。WEISSMAN 早就提出了可以通过基因组 DNA 饱和杂交的原理将 cDNA 文库进行均一化的理论。但该理论一直以来都被认为不能应用于实际。其主要限制因素是难以提供足量的极低表达丰度的 cDNA 用于饱和杂交,从而可能会造成部分基因的 cDNA 的丢失。20年前,基于 DNA-RNA 杂交的研究就已经将基因的转录水平分为高中低3类。随后研究进一步表明,绝大多数基因是处于中等或低等表达丰度的,在单个细胞中含有近1~15个拷贝,而高丰度表达基因的转录产物在单个细胞中最高可达5000个左右拷贝,约占总表达量的25%。这种基因表达能力上的巨大差异成了获得一个具有完整代表性的 cDNA 文库的障碍,其表达量上的巨大差异更为大规模研究增添了困难。对单一组织的 cDNA 文库而言,高拷贝基因序列的大量存在给基因的筛选和鉴定带来不必要的浪费,尤其是在大规模的 EST 测序中。均一化 cDNA 文库是克服基因转录水平上巨大差异给文库筛选和分析带来障碍的有效措施,有利于研究基因的表达和序列分析。现在,在构建均一化的 cDNA 文库中至少有2种主要的观点:一种是基于复性动力学的原理,高丰度的 cDNA 在退火条件下复性的速度快,而低丰度的 cDNA 复性要很长时间,从而可以通过控制复性时间来降低丰度;另一种是基于基因组 DNA 在拷贝数上具有相对均一化的性质,通过 cDNA 与基因组 DNA 饱和杂交而降低在文库中高拷贝存在的 cDNA 的丰度。 第一种方法的掌握对技术的要求比较高,对多数人而言需要多次摸索才能找到最适条件;
温馨提示:内容为网友见解,仅供参考