推荐活动

【人类基因组计划】解密上帝的语言 天使or魔鬼?

首页 » 产业 » 杂谈 2014-11-14 知因 赞(7)
分享: 
导读
有人天赋异禀,成为天才,成为鬼才,有的人却成为“天鬼才”。

DNA测序时代开始

  虽然早在1953年,沃森和克里克就发现了不朽的DNA(脱氧核糖核酸)双螺旋结构,但是长久以来,人们始终都找不到很好的办法测定DNA中四种碱基——A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)——的排列顺序。

  上帝的语言是如此的小,还没有人看得到,天才,鬼才就是为大问题而生的。咿~呀~

  这种窘境直到一位名叫Frederick Sanger的大牛发力才得以打破。(尽管要维护汉语的纯洁性,我们不妨为Sanger君开开后门,他的名字就不翻译成汉语了。)

  说起这个Sanger君,早就是牛的不得了的人物了。早在1955年,他就发明了一种通过电泳鉴定蛋白质结构的方法,并且因此单独获得了1958年的诺贝尔化学奖。

  到了1975年,双螺旋结构发现20余年后,Sanger君又发明了一种称为“链终止法”的方法来测定DNA的序列。

  测量DNA的序列,就像搞清楚一条铁链每一环的顺序一样,我们可以先将铁链按照1节、3节、5节……13节、15节……167节、169节等等不等长的顺序截断,这样我们根据断链的长度就可以知道断链的先后顺序,然后用同样的方法把较长的断链的顺序搞明白。可是打断铁链容易,准确截断DNA则不是那么容易的事情。而“链终止法”,又叫“Sanger法”,就是一种通过准确的截断铁链上某种特定类型的环来测量DNA序列的方法。

  我们知道DNA的信息是由ATCG四种碱基书写的,由于DNA的双链结构,每个碱基都以A-T、G-C的配对方式和对应的碱基形成一个碱基对,即1个bp(base pair),1bp可以理解为DNA天书上的一个字节。在DNA复制的过程中,原来的DNA链作为“模板”,通过A-T、G-C的碱基配对方式合成新的DNA单链。而合成新DNA的原料就是dNTP(N代表A、T、G、C),称为脱氧三磷酸X苷(X代表与A、T、G、C相对应的腺、胸腺、鸟、胞)。Sanger通过在dNTP身上做手脚,使得DNA复制时,做过手脚的‘dNTP’(ddNTP,双脱氧三磷酸X苷)和模板的碱基配对以后,复制即停止。如此一来,新合成的DNA单链即变成在不同位置终止的残缺片段。这些片段因为长度不同而拥有不同的分子量,通过电泳的方法即可轻易的被分开。

  例如,假设有一段20个碱基(bp)的DNA片段,科学家想要测定这段DNA的序列。那么,在复制这一段DNA的时候,加入正常dNTP作为原料的同时,再加入一些做过手脚的ddTTP。如果ddTTP和第二个位点的腺嘌呤(A)结合,那么合成过程就会在这个位点终止,新合成的DNA链只有2个bp,相对分子量就是2。如果ddTTP和第八个位点的腺嘌呤(A)结合,那么新合成的DNA有8个bp,相对分子量就是8。随后通过化学方法将这些完整的、不完整的DNA链解开,用电泳的方法把这些DNA链按不同的分子量分开,我们就能看到,最后产生了一些相对分子量分别为2(在第二个位点和模板结合的 ddTTP)、8(在第八个位点和模板结合的ddTTP)以及20(完整的DNA片段)的DNA单链。由于DNA的复制只能按由5'端到3'端的方向进行,那么通过这种方法,我们就能推测出,这段DNA从5'端开始的第一位和第八位的碱基都是腺嘌呤(A)。

  如此再根据互补原则,分别加入动过手脚的ddATP、ddCTP、ddGTP,即可依次测出这段DNA的T、G、C碱基的位置。如此就能测出这段DNA完整的碱基序列。Sanger成功的用这种方法测出了一些碱基对数目很小的病毒DNA的。他也凭此项发明获得了1980年的诺贝尔化学奖,至此,Sanger君成为目前世界上唯一一位获得过两次诺贝尔化学奖的科学家。

  但即使是如Frederick Sanger这般独此一家,别无分号的大牛人也有解决不了的问题。

  Sanger法的缺陷在于:

  1.只能测定病毒等碱基数目较小的DNA,无法应付如人类这般成千上百万碱基对构成的DNA。

  2.测定碱基序列需要大量完全相同的DNA拷贝,即必须将要测定的DNA复制很多倍以后才能进行测定。一般的样本很难满足其DNA数量上的要求。

  因此,科学家们能测定的DNA碱基(300~500bp)序列的长度非常有限,对稍大的DNA完全束手无策。好在不久之后,科学家们即在大肠杆菌(E. coli)中发现的一种特殊的限制性内切酶,具有能将特定序列的DNA切成小片段的特性。这种叫做EcoR I(英文全称)的酶,帮科学家们解决了Sanger法的第一个难题,即使再大的DNA分子,也能通过限制性内切酶切割成小片段进行测序。

  同样,EcoRI对于解决第二个难题,即DNA数量上的不足,也有很大的帮助。EcoRI切下的DNA小片段的断端具有粘性,如果用同样的酶把酵母菌(或细菌)的DNA也切开,这些需要研究的小片段就能与酵母菌DNA的断端粘在一起,然后重新闭合。如此,被切开的DNA片段就被插入到酵母的DNA中去了。这个就叫做“基因重组”。由于酵母DNA分裂复制的速度非常快,这些被插入的片段也能一起被快速的复制。这个过程称为“克隆扩增”。当达到需要的拷贝数时,研究者则通过EcoRI再把需要的片段切下来用。

  由于EcoRI的发现,解决了基因测序上的多个难题,限制性内切酶的发现者,Werner Arber, Daniel Nathans, 和Hamilton Smith共同获得了1978年的诺贝尔医学和生理学奖的殊荣。

  同样是诺贝尔奖,有些人要3个才能合拿一个,有的一个人就能拿两个奖,可见牛人们也是分等级的。

  于是通过Sanger等人(此后Maxam、Gilbert等人又改进了Sanger的方法)发明的DNA测序技术和EcoRI等限制性内切酶的结合,科学家们很快就开始在生物基因组这片从未被开垦过的处女地上疯狂的耕耘起来。到了上世纪80年代末,人们已经能够测定高达100,000bp的完整病毒基因组。

  随着基因组研究的飞速发展,一个以前人们连想都不敢想的计划逐渐在科学家们的脑海中盘旋——他们想要测定人类整个基因组的碱基序列,把人类基因组的30亿个碱基一个一个的检测出来。他们想要破解上帝留给人类的基因“天书”。

人类基因组计划

  The nations of the world must see that the human genome belongs to the world's people, as opposed to its nations.

  “世界上的国家都必须意识到,人类基因组属于全人类,而非属于某些国家。”

  ——James D. Watson分子生物学家,DNA双螺旋结构发现者之一,1962年诺贝尔医学和生理学奖获得者

  二十世纪80年代,随着基因测序技术的发展,以及计算机技术的介入,DNA的测序工作变得越来越易于操作,越来越多生物的基因组被辨识,人们不禁畅想:什么时候我们可以把人类基因组的30亿个碱基对的序列统统辨识出来呢?

  1984年,美国能源部(United States Department of Energy)首次将旨在对人类基因组测序的人类基因组计划摆上议事日程。虽然此前科学家们已经断断续续测出总计约3700万个碱基对的人类基因序列,但这仅占整个人类基因组的1%多一点。显然,任何个人或团体要想在有生之年达成测序30亿个碱基对的目标,光靠愚公移山的精神是不够的。这不只涉及到大量人力、物力的投入,还要求大量的资金支持。根据当时的技术水平,平均每测量一个碱基对需要的成本约3~5$,而一共有30亿个碱基对需要测定。这样庞大的投资,不是单独的个人或者团体能够负担的,甚至单个的国家都不一定有如此雄厚的财力支持这个计划。因此美国能源部的人类基因组计划一直难以有什么实质性的进展。

  直到1988年,美国国家卫生研究院(National Institutes of Health,NIH)来了一个人,这个人的出现使得人类基因组计划真正的开动起来。这个人,就是我们“基”督教的第二任教皇,DNA双螺旋结构的发现者之一,不过这个年纪了,应该去当太上皇,挑好继任者,鼓励中层干部才是他的任务。

  鼎鼎大名的沃森的加入不啻为人类基因组计划的一记强心针。1990年,NIH和美国能源部为他争取到30亿美元的巨额预算用于测序工作,人类基因组计划正式启动。随后,在各国科学家的努力下,英国、法国、德国、日本、中国和印度先后加入了这个庞大的计划。(注意啊~中国的华大基因也代表国家出席了这场盛会。)人类基因组计划终于成为一个国际性的科研计划。

  当然了,给人类的基因组测序并非如给只有区区100kbp的病毒基因组测序那么简单。人类的基因组共有30亿多个碱基对,通过限制性内切酶可以把它们切成 1mbp(一百万个碱基对)大小的片段,再转到酵母上进行克隆扩增。为了搞清楚放到酵母菌里克隆扩增的到底是哪一段DNA片段,科学家需要一种名为序列位置标签(Sequence Tagged Site, STS)的基因片段来定位。

  如果把人类基因组视为一片广阔的土地的话,那人类基因组计划无疑就是为这片土地测绘地图的工作。为了更好的描绘地图,避免在测绘的时候迷路,科学家们需要先在地图上标记一些独特的、整片土地上只有一个的标志物来作为地标,然后在地标之间详细地描绘地图上的细节。而STS,作为一段200~500bp的 DNA片段,每一段STS都只能在人类基因组中找到一次,而且这段STS在哪条染色体的哪个位点的哪个具体位置上,科学家们都已经通过PCR的方法确定了。因此,给一段DNA测序完以后,只要再找到这段DNA上STS的位置,就能推知测出的是哪个位置的DNA序列了。

  虽然电子计算机的应用大大减少了科学家们的工作量,但为基因组测序仍然是漫长而枯燥的工作。沃森原本预计花费15年完成人类基因组的测序工作。

  终于时间到了,沃森退位。

  人类基因组计划开始没多久,在1992年,沃森即因为反对给人类基因申请专利而被NIH炒了鱿鱼,灰头土脸的离开了这个项目。当时NIH的研究人员通过一项技术辨识出了一段cDNA片段。NIH试图为这段cDNA申请专利,因为为基因申请专利所带来的利润可以刺激相关学科的发展。但沃森却认为所有与人类基因有关的知识都应该免费与全人类共享。由于和领导意见的巨大分歧,沃森不得不卷铺盖走人。当时的人们以为沃森是廉颇老矣,可后来事件的发展却证明姜还是老的辣。那些新生的小牛犊们固然有十八般武艺,也不及老牛的高瞻远瞩,远见卓识。

  老教皇退位了,谁来继任呢?

天才接手,面临鬼才竞争

  1993年,时年43岁的柯林斯接替了沃森的工作,开始领导国际基因组计划。此前柯林斯的成就主要是发现了包括亨廷顿舞蹈病、M4型急性淋巴细胞白血病在内的多种疾病相关的基因,人送外号“基因猎手”(很威风的外号)。不过,柯林斯固然牛,但大牛们的光环不再,人类基因组计划这艘大船在柯林斯这位虔诚的教主的带领下,战战兢兢的往前行,即将迎来狂烈的风暴,差点面临翻船的危险。

  这暴风的源头,源于在人类基因组计划进行到第八年,1998年,一个新时代的鬼才横空出世。这位魔鬼一发力,即在学界搅起一阵轩然大波(或者说是一阵妖风),经历诸多坎坷,倒反使得人类基因组计划较预期提前了好几年即告完成。

  学界对此大牛议论纷纷,有说他对人类基因组研究做出巨大贡献的,有说他是搅屎棍的,还有人说他是弗兰肯斯坦一般的科学怪人,这个人就是Craig Venter(得~我又得破坏中文的纯洁性了,这位鬼才的名字我就不翻译成中文了)。

  俗话说“江山代有才人出,一代更比一代强。”到了二十世纪末,在人类的DNA探索史上留下里程碑的第三代领导集体逐渐退休,第三代教皇又没能镇住场子。而新时代的弄潮儿,非Craig Venter君莫属。是的,你没看错,这位Craig Venter正是最近风头正劲,制造出首个的人工合成基因组支配的细胞的那个科学家Venter。

  这张肖像正好反映出Venter在世人眼中亦正亦邪的形象

  Venter君是个怪才。高中时,他无心学习,却迷恋于水上运动以及泡妞,差点因为成绩太差而退学。后来Venter应征入伍。越战期间,他在越南的美军野战医院服役。这段经历想必给了Venter君相当强烈的刺激。回国以后,Venter君开始发奋图强,拼命考证。在风景如画的加州大学圣地亚哥分校,他获得了生化学学士(1972年)、生理学和药学博士(1975年)一共三个学位。

  随后,Venter君到纽约州立大学水牛城分校担任教授。在这个地方,Venter君抛弃了他的前妻,与自己的学生,年轻貌美的Claire M. Fraser结为连理。1984年,Venter来到了NIH(就是老牛沃森领导人类基因组的那个地方)。

  在NIH,发生了两件事情,对Venter君造成了很大的影响。一件事情,是Venter所在的研究院通过一项技术辨识出了一段cDNA片段。NIH试图为这段cDNA申请专利(还记得老牛沃森吗?他就是因为这件事,得罪了第三代,被NIH炒了鱿鱼。),结果败诉,法院认为这段DNA不具备申请专利的条件。而这项申请案正是Venter负责的。

  另一件事情,Venter发现用之前提到的Sanger君发明的“链中止法”给基因一个一个的测序效率实在太差,由此导致整个人类基因组计划的进度严重落后。于是他建议使用速度更快的“鸟枪法”测序。但是此提议遭到NIH的科学家们的一致反对。因为这件事情,Venter君心灰意懒,决定把上司炒了自己单干。

  1998年,Venter筹集资金,建立了塞雷拉基因组(Celera Genomics)公司,开展自己的人类基因组计划。不让我玩,我就自己玩;不让我领导你,我就取代你,世界就是这么残酷。

  塞雷拉公司所采用技术,就是俗称“鸟枪法”的“全基因组霰弹枪定序法”(Shotgun sequencing)。这种方法通过把整个人类基因组样本随机断裂成上百万个小碎片,然后用“链中止法”给这些碎片测序。通过计算机辨识碎片中重叠的部分,再把这些碎片拼接起来,形成完整的DNA序列。

  这种方法不需要预先检测出测序的小片段的具体位置,只需要将打碎的片段统统测序完,再送到电脑里运算就行了。由于是一口气把整个基因组打碎了来测量,相比传统一条一条染色体测绘的方法,鸟枪法要快很多。然而,由于人类的染色体在某些部位(端粒和着丝点)有着大量重复的序列,用鸟枪法检测这些序列的时候,计算机正是靠不同片段之间重复的部分来判断序列的位置,这些高度重复的序列会导致计算机算出错误的结果,也就是说,鸟枪法处理这些有着重复序列的部分并不十分精确。这也是国际基因组计划的科学家不认可这种方法的原因,他们更倾向于速度慢,但是准确性更高的“链终止法”。

  不认可归不认可,Venter用这种方法获得了成功。塞雷拉公司很快就赶上并且超过了国际基因组计划的进度。本来大家以为这也就算科学家的意气之争,但公众绝对料想不到,接下来事情的发展大大超出世人的想象。塞雷拉公司刚开始测序计划的时候,同意将得到的数据和国际基因组计划分享。然而,他们拒绝像国际计划一样,把得到的数据放到网上和全人类共享,也禁止他人自由发布或无偿使用他们得到的基因数据。也就是说,别人想用他们的数据,必须花钱。

你们的基因,我们承包了

  到1999年,塞雷拉公司更是作出惊人之举,他们为人类的6500个基因申请专利保护。一旦他们得逞,今后每个地球人体内都将有6500条基因归塞雷拉公司所有,任何人想要检测自己体内的这些基因,或者医药公司想要研发和这些基因有关疾病的新药,抑或科学家想研究这些基因都要给塞雷拉公司交钱。

  可以想象,塞雷拉公司和Venter的举动成了众矢之的,人们纷纷指责他们的自私自利会严重妨碍遗传学的发展。这事越搞越大,最后惊动了中央人民政,额不,美国政府,2000年3月14日,时任美国总统,比尔?克林顿和英国首相布莱尔联合发表声明称人类基因组数据不允许专利保护,且必须对所有研究者公开。如今,任何人都能轻易的在GenBank网站上查到人类基因组的信息。

  于是Venter和他的塞雷拉公司受到严重的打击。克林顿发表声明的当天,塞雷拉公司的股票就暴跌。他们今后不仅不能通过申请专利赚钱,还不得不把所有的数据都向公众公开。此时,人们不得不佩服老沃森当年的远见卓识,人类基因组计划是为了整个人类谋福利的,任何想将这一成果据为己有的企图都会受到各方面的阻挠。

Venter虽牛,却没牛到与全世界为敌吗?~

  不过,挫折归挫折,塞雷拉公司仍然保持着基因组测序方面的优势,只要能抢先完成人类基因组测序,Venter他们至少能够获得首个完成人类基因组测序工作的研究者的殊荣。即使赚不到钱,至少也要拿到这个对科学家来说至高无上的荣誉。

  柯林斯的压力很大,他从大名鼎鼎的沃森那里接过衣钵,带领由各国政府资助、全世界科学家共同参与的基因组计划,这衣还未穿~钵还未捂热,就有人来抢了,现在已经落后于Venter组建的小小的民间机构。更糟糕的是,他的竞争对手声称要把这个成果据为己有,以此向全世界人民收钱。如果让Venter率先完成基因组的测序,这无论如何是难以令人接受的,届时光媒体的口水都能淹死他。

  为了能赶上进度,柯林斯一方面“部分的”引进了鸟枪法,另一方面他开始秘密接触Venter。即使不能抢在他前面,至少要争取到和他共同完成基因组计划的结果。私下的接触自然没有得到什么结果,甚至演变成了激烈的争论,后来又惊动了克林顿。好在总统的面子够大,双方终于妥协,塞雷拉放弃对人类基因的专利要求,而完成人类基因组计划的殊荣将由双方共同获得。

  2000年6月26日,伟大的时刻终于来临,美国总统克林顿等六国领导人共同宣布人类基因组计划的草图完成。(附带说明一下,之所以说完成的是“草图”,正是因为鸟枪法无法准确的测序那些高度重复的序列。因此当时公布的草图并不包括这些部分。)

  “今天,我们知道了上帝用以创造生命的语言。对于上帝带来的这份神圣礼物中所展现的复杂、精致和奇妙,我们怀有更多的敬畏之情。”

克林顿 2000.6.26 于白宫

  好了,“基”督教的圣经”草图”画好了,信众们,来吧~

  人类基因组草图的完成,也有中国人的一份贡献。早在1993年,中国就启动了自己的人类基因组测序计划,并且先后在上海、北京成立了南方、北方两个基因组中心,积累了很多基因组测序的经验。1999年9月,中国加入国际基因组计划,负责人类3号染色体上的3000万个碱基对的测序工作,占人类基因组碱基对总数的1%。2000年4月,中国的科学家们顺利的完成了这3000万个碱基对的测序任务,为人类基因组计划贡献了一份力量。

  2001年2月,Venter和Collins分别发表了各自的基因组研究成果。有趣的是,即使是发文章,这两个人还闹别扭,Venter把文章发到了《Science》,而Collins则发到了《Nature》。

  可惜的是,荣誉不能当饭吃,由于不能为人类基因申请专利,不能给公司带来利润,尽管Venter推出了$1,000的私人基因组测序套餐(听起来还是挺诱人的),但是应者寥寥,公司的业绩始终没有起色。终于,塞雷拉公司的股东们忍无可忍,炒了Venter的鱿鱼。

  失业的Venter带着在塞雷拉赚到的10亿美金回到了老家以后,把自己的游艇改造成了研究船,跑到百慕大三角去研究海洋生物去了。看起来,这只是个不起眼的研究,但是这个浑身上下散发着非主流气息的科学怪杰难道会甘心做一些无关紧要的研究工作吗?在Venter那神秘的研究船上,这个颇受争议的科学家难道是在酝酿什么骇人的邪恶计划,还是在为人类的未来谋福利呢?

  人类基因组计划的故事到此暂告一段落,各种人类基因组计划的衍生品还在被科林斯们进行着。临床应用也慢慢铺开,科林斯们故事似乎就将这样慢慢进行下去。

  但是Venter的故事看来刚刚开始……其实,如果你还记得前阵子合成生命的传奇,你就知道Venter这些年确实没闲着。

  一群科林斯们翻译”上帝的语言“,而Venter将用这些结果吟诗作赋,看来Venter的这盘棋很大啊!

(转化医学网360zhyx.com)
评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发

相关阅读