基因文库技术分离目的基因 所谓文库(1ibrary)是指一种全体的集合。基因文库(gene library)则是指某一生物类型全部基因的集合。这种集合是以重组体形式出现。某生物DNA片段群体与载体分子重组,重组后转化宿主细胞,转化细胞在选择培养基上生长出的单个菌落(或噬菌斑)(或成活细胞)即为一个DNA片段的克隆。全部DNA片段克隆的集合体即为该生物的基因文库。 构建基因文库的意义不只是使生物的遗传信息以稳定的重组体形式贮存起来,更重要的是它是分离克隆目的基因的主要途径。对于复杂的染色体DNA分子来说,单个基因所占比例十分微小,要想从庞大的基因组中将其分离出来,一般需要先进行扩增,所以需要构建基因文库。在很多情况下目的基因的分离都离不开基因文库。此外基因文库也是复杂基因组作图的重要依据。基因文库构建包括以下基本程序: ① DNA提取及片段化,或是cDNA的合成。 ② 载体的选择及制备。 ③ DNA片段或cDNA与载体连接。 ④ 重组体转化宿主细胞。 ⑤ 转化细胞的筛选。当获得了含重组体的宿主细胞时,即完成了基因的克隆。基因的克隆只是分离基因的基础,基因克隆后还要对克隆的基因进行分离,即利用各种手段把目的基因从文库中分离出来。分离出目的基因还必须对其进行必要的检测与分析:如进行序列测定,体外转录及翻译、功能互补实验等。通过这些实验确定出基因的结构及功能。到这时才能算分离到了目的基因。所以,基因的克隆、克隆基因的分离、分离基因的鉴定是利用基因文库技术分离目的基因的主要内容。一、基因文库的类别 1. 基因组文库与cDNA文库 根据基因类型,基因文库可分为基因组文库及cDNA文库。基因组文库是指将某生物的全部基因组DNA切割成一定长度的DNA片段克隆到某种载体上而形成的集合。 cDNA文库是指某生物某一发育时期所转录的mRNA经反转录形成的cDNA片段与某种载体连接而形成的克隆的集合。 基因组文库根据DNA来源又有核基因组文库、叶绿体基因组文库及线粒体基因组文库。 基因组文库与cDNA文库的区别在于cDNA文库是有时效性的。文库构建时的信息供体是某一时空条件下的细胞总mRNA,它是在转录水平上反映该生物在某一特定发育时期,某一特定组织(或器官)在某种环境条件下的基因表达情况,并不能包括该生物有机体的全部基因。在某种意义上讲它可以表现基因组的功能信息。再者,cDNA文库只反映mRNA的分子结构。cDNA中不含有真核基因的间隔序列及调控区,确切说cDNA并不是真正意义上的基因。基因组文库构建时遗传信息供体是基因组DNA,因而无发育时期及组织器官特异性,在一个完全的基因组文库中包含着基因组DNA上的所有编码区及非编码区序列的克隆。生物有机体的每一个基因在文库中都有其克隆,该克隆的基因片段里包括着间隔序列,所以基因组文库可真实地显示基因组的全部结构信息。目前这两类基因文库在基因工程中都得到有效应用。选择哪一种,主要是根据实验目的。在分离RNA病毒基因,研究功能蛋白序列,分离特定发育阶段或特定组织特异表达的基因时应构建cDNA文库。在研究mRNA分子中不存在的序列及基因组作图时必须构建核基因组文库。 2. 克隆文库及表达文库从基因文库的功能上看可分为克隆文库及表达文库。克隆文库由克隆载体构建。载体中具复制子、多克隆位点及选择标记,可通过细菌培养使克隆片断大量增殖。表达文库是用表达载体构建。载体中除上述元件外,还具有控制基因表达的序列(如启动子、SD序列、ATG、终止子等),可在宿主细胞中表达出克隆片段的编码产物。表达载体又有融合蛋白表达载体及天然蛋白表达载体之分。 从克隆文库中分离目的克隆时主要利用核酸探针,可以是根据蛋白质序列合成的寡核苷酸探针,也可以是同种或同属生物的同源序列探针。从表达文库中分离目的克隆时,因克隆片段的表达产物蛋白质具有抗原性及生物活性,所以除核酸探针外,还可以利用免疫学探针及生物功能进行筛选。表达文库适合于那些不知道蛋白质的氨基酸序列、不能用核酸类探针筛选的目的基因的分离。 3.不同载体的基因文库 目前用于构建基因文库的载体主要有质粒、噬菌体、黏粒及人工染色体四大类。每类中又有许多不同的载体。不同的载体适于构建不同的基因文库。(1). 质粒文库 质粒是最早用于基因克隆的载体。现已有各种适用于不同工作的如克隆、表达、测序等专用商品质粒。但在构建基因文库上,由于质粒相对较小并只能容纳比自身更小的片段,因此它不能用于构建核基因组文库,通常只用来构建短序列的克隆文库。例如叶绿体DNA分子较小,可以用质粒构建叶绿体DNA文库。质粒载体可用于生物cDNA文库构建。但只适合于高丰度的mRNA。(2). 噬菌体文库 目前用于基因克隆的噬菌体载体及其衍生载体很多,如单链的M13噬菌体载体、λ噬菌体载体、P1噬菌体载体、噬菌粒(phagemid或phasmid)等。其中使用最多的是入噬菌体。 λ-DNA为双链结构,长49kb。线性分子两端各有一条12个核苷酸的黏性末端称cos位点。分子中有约15kb可去掉的非必要基因区,又称“填充区”, “填充区”两侧的序列含有其增殖所必需的全部基因,称为左、右臂。“填充区”可被外源DNA取代,构成重组体,这是它成为克隆载体的结构基础。由于噬菌体头部包装容量的限制,重组λ-DNA分子大小只能在39—52kb之间。(3). 黏粒文库 黏粒(cosmid)也称柯斯质粒,是人工构建的由λ噬菌体的COS序列、质粒的复制子序列及抗生素抗性基因序列组合而成的一类特殊的质粒载体。COS序列是DNA包装进噬菌体颗粒所必须的。复制子通常是使用ColEl或pMBl的复制起始位点。黏粒具有λ噬菌体的某些性质,在克隆了大小合适的外源DNA片段并且在体外被包装成噬菌体颗粒后,能高效转导对入噬菌体敏感的大肠杆菌宿主细胞。在宿主细胞内按λ噬菌体方式环化,但不能通过溶菌周期,无法形成子代噬菌体颗粒(因分子中不具入噬菌体全部必要基因)。它也具有质粒载体的主要性质,在宿主细胞内可以像其他质粒一样复制,并与松弛型质粒相同,适量的氯霉素可促进扩增。因具抗生素基因,可以通过抗生素抗性筛选重组子。黏粒载体在构建时也加上了设在插入失活基因内的多克隆位点。黏粒载体的分子较小(2.8—24kb),但克隆容量很高,对外源DNA长度的要求是30~45 kb,上限几乎是入噬菌体载体容量(23 kb)的2倍,所以黏粒载体在核基因组文库构建上具有相当的优势,可克隆包括3,和5’调控区在内的完整的植物基因。(4).人工染色体文库 人工染色体载体是利用真核生物染色体或原核生物基因组的功能元件构建的能克隆大于50kbDNA片段的人工载体。其中有的载体既可用于克隆,又能直接转化,是进行基因功能研究的良好载体。近年来陆续发展起来的人工染色体文库有YAC库、BAC库、BIBAC库、PAC库及TAC库。二、核基因组文库构建核基因组文库构建主要使用λ噬菌体置换型载体或黏粒载体。 1. 随机文库克隆数目随机文库指代表基因组各部分DNA的摩尔数相等。对于随机文库: N = ln(1-P) ; ln(1-x/y) N:克隆数目 P:设定的概率值(如:0.99,表示在片段随机分布时,从文库中找到任一序列的概率不低于0.99) x:插入片段平均大小(15~20kb) y:基因组的大小(以kb计) 如果插入片段平均大小为20kb,某基因组大小为4X108bp,P = 0.99时,根据上式N = 1X105。含1XlO5个克隆的基因文库相当覆盖了5倍的基因组,在片段随机分布时,从文库中找到任一序列的概率不低于0.99。随机片段可通过机械切割或限制酶消化产生。机械切割法可获得较均一的随机片段,但片段不能直接用于克隆,需经末端修饰、甲基化,连上接头后再用限制性内切酶消化产生黏性末端。用限制酶消化的方法虽然可直接产生黏性末端,但片段的随机性较差,所以采用后种方法时,文库的克隆数目应大于计算值。三、利用PCR技术构建c DNA文库 cDNA文库构建的起始信息物质是mRNA。因此构建cDNA文库首先要考虑的问题是mRNA的含量及质量。生物细胞中mRNA含量较低。通常cDNA文库构建需要ug级的mRNA。对于低丰度的mRNA(<0.5%),要通过富集或增大克隆数目来保证构建的文库中能够含有它们的克隆
含有某种生物不同基因的许多DNA片段,导入受体菌的群体中储存,各个受体菌分别含有这种生物的不同的基因;
如果这个文库包含了某种生物的所有基因,那么,这种基因文库叫做基因组文库。如果这个文库只包含了某种生物的一部分基因,这种基因文库叫做部分基因文库,例如cDNA文库,首先得到mRNA,再反转录得cDNA,形成文库。cDNA文库与基因组文库的区别在于cDNA文库在mRNA拼接过程中已经除去了内含子等成分,便于DNA重组时直接使用。
应用
建立和使用基因文库是分离基因,特别是分离高等真核生物基因的有效手段。如果一个哺乳动物的基因组是 3×109碱基对,直接从细胞中提取并分离出某一特定基因的DNA片段在技术上是很困难的。但是在基因文库中,不同的 DNA片段都分别在不同的克隆中扩增了,只要有该基因的探针存在,则从许多克隆中筛选一个所需的克隆是一项比较简单的工作。
此外基因文库中被克隆的DNA都是基因组中各种随机的顺序片段,某些 DNA片段还包括基因外部的邻近的甚至互相跨叠的序列,所以基因文库特别有利于研究天然状态下基因的顺序组织。例如曾从人的基因文库中分离得到含有血红蛋白β链基因的克隆,从中取得该基因的DNA并进行分析,发现人的δ和β链基因是连锁的,二者之间相隔几千个碱基对,而且在它们内部都有两个内含子。
基因文库包括基因组文库和部分基因文库。将含有某种生物不同基因的许多DNA片段,导入受体菌的群体中储存,各个受体菌分别含有这种生物的不同的基因,称为基因文库。如果这个文库包含了某种生物的所有基因,那么,这种基因文库叫做基因组文库。如果这个文库只包含了某种生物的一部分基因,这种基因文库叫做部分基因文库,例如cDNA文库,首先得到mRNA,再反转录得cDNA,形成文库。cDNA文库与基因组文库的区别在于cDNA文库在mRNA拼接过程中已经除去了内含子等成分,便于DNA重组时直接使用。
建立和使用基因文库是分离基因,特别是分离高等真核生物基因的有效手段。如果一个哺乳动物的基因组是 3×109碱基对,直接从细胞中提取并分离出某一特定基因的DNA片段在技术上是很困难的。但是在基因文库中,不同的 DNA片段都分别在不同的克隆中扩增了,只要有该基因的探针存在,则从许多克隆中筛选一个所需的克隆是一项比较简单的工作。此外基因文库中被克隆的DNA都是基因组中各种随机的顺序片段,某些 DNA片段还包括基因外部的邻近的甚至互相跨叠的序列,所以基因文库特别有利于研究天然状态下基因的顺序组织。例如曾从人的基因文库中分离得到含有血红蛋白β链基因的克隆,从中取得该基因的DNA并进行分析,发现人的δ和β链基因是连锁的,二者之间相隔几千个碱基对,而且在它们内部都有两个内含子。
基因文库还可以应用在个体发育的研究中。例如从芽孢杆菌的正在形成芽孢的菌体中分离mRNA,并用同位素标记做成探针,用这些探针可以从芽孢杆菌的基因文库中分离出只在芽孢形成过程中活动的基因,有助于对发育过程中基因调控进行研究。
基因文库也可以应用在高等生物,例如人的基因定位工作中。基因文库在生产实际中也是取得所需要的基因的一种重要方法。
中国建立了人口健康基因检测科学社会工程,力使我国从整体上提高我国人口的健康和保健水平。
工程目标:第一期认证、提供可用于健康检测的不少于50种疾病的易感基因位点并逐年增加:建立1000个授权检测站;达到年检测3000万人次的检测服务能力;建立“中国复杂人群基因-环境数据库”;实现包括检测服务于产品销售总收入超过100亿元的健康产业规模;为社会提供数以万计的就业机会。
在经济、社会和科技效益方面有良好的成效。
基因组文库的意义是从中找到自己想要的B-A-C克隆,进行目的基因定位,测序