破译剪接体“密码”

14.09.2015  19:47

来源:文汇报 2015-9-13 郭礼和

  8月21日,清华大学生命科学学院施一公教授带领的研究团队关于剪接体三维结构、RNA剪接的分子结构基础重大研究成果的两篇论文,同时被美国《科学》杂志在线发表。

  这是中国科学家在本土做出的又一项“可能得诺贝尔奖”的工作。生命科学领域的这一重大原创性突破,标志着人类对生命过程和本质的理解,往前迈进了关键一步。

什么是剪接体

  剪接体实际上是蛋白核酸的复合体,可以归为细胞器,其大小约等于60个S(离心沉降单位),其功能主要是对前体信使核糖核酸(pre-mRNA)进行加工,去除插在编码序列中间的非编码序列(所谓“内含子”),使所有编码序列(所谓“外显子”)连贯起来,以便产生成熟的信使核糖核酸(mRNA)。

  剪接体的加工场所位于细胞核内,然后加工产物(mRNA)与相关蛋白结合,成为核蛋白体,再运输到细胞质里与蛋白质合成工厂——核糖核蛋白体结合,用来指导蛋白质合成。

  遗传信息传递中心法则就是:首先,将DNA遗传信息转录成前体信使RNA(这步称为“转录”);然后,把前体信使RNA加工成成熟的mRNA(这步称为“剪接”或“加工”);第三步是将成熟的mRNA输运到细胞质里来指导蛋白质合成(这步称为“翻译”)。“转录-剪接或加工-翻译”就是细胞内遗传信息传递的三部曲。

结构生物学三部曲

  从结构生物学来讲,这三步的复合体应该说都很重要。第一步转录复合体结构的阐明得到了2006年的诺贝尔奖,第三步翻译复合体的结构研究工作在2009年也得到了诺奖。作为第二步的剪接体结构研究工作成果,从常理上来讲也应获得诺贝尔化学奖,这样才能算作完整的三部曲。但是不确定性在于,第二步中还有一个更基本现象阐明的工作,即基因编码连续和不连续性现象及其机理的揭示。

  人们开始认为,基因在DNA上的编码序列是连续的,就像文章中的句子是完整的(句子意思表达完整,句子中间不存在废话),这种基因编码连续性在原核生物(细胞内部不存在细胞核,例如细菌等生物)是真实的。后来在真核细胞生物里(具有细胞核的生物,例如动植物)恰恰不是这样,发现在DNA上的基因编码序列是不连续的,内部不同部位插入了许多不编码的核酸序列(称谓“内含子”)。

  基因转录成前体信使RNA产物包含了许多“内含子”,就像写出的句子里含有许多废话,造成语句不通。前体mRNA需要剪接体将这些“内含子”剪出,同时将编码序列(外显子)中心连接起来,形成成熟的mRNA。也就是将句子里的废话剔除,使句子意思表达清晰。

  为什么生物从原核进化到真核,基因内会出现许多“内含子”?这一现象的生物学意义是什么?后来发现“可变剪接体”,它可以不按常规序列剪接,同一前体mRNA可以剪接成不同的成熟mRNA,从而指导不同蛋白质的合成。也就是一个基因可以编码几个蛋白质,从而丰富了基因的内涵。这就说明人类基因组的序列分析,虽然基因组只编码2.5万个人类基因,但产生的蛋白质种类竟有十几万之多,增加了生命活动的复杂性。

  同时,这种可变剪接体如不按生理机能需要剪接,就会产生病理性的蛋白质,引起多种疾病。

  上述基因编码不连续现象及其机理的研究从1977年已经开始,至今已经做了大量工作,并取得极其重要的研究成果。

  从理论上来讲,这些基础研究显得更为重要。相比之下,弄清剪接体的结构只是一种技术层面的重大进展,而上面大量的基础研究成果至今还未获得诺贝尔奖,若结构生物学研究成果先获诺奖,好像有点不合常理。

得诺奖并非衡量 价值的唯一标准

  从科学史看,得诺奖的工作并非个个重要,有些获奖成果后来证明弄错了。同样,未获诺奖的研究成果也并非不重要,例如爱因斯坦是因光电效应研究而获诺奖,而不是“相对论”,不能说光电效应比“相对论”更重要。

  应该承认,剪接体的结构解析也并非一家之力,国际上至少有近十家单位在做类似工作,只是在分辨率上没有清华施一公团队做得高。施一公团队这次的工作,也是在前人基础上发展起来的,不是完全的白手起家。其实很多得诺奖的工作都是同行们不断努力,是站在前人工作成果基础上提升的结果。

  回过来看,剪接体结构阐明当然很重要,因为是三步中的一步,所以无疑也是核心的工作。去年中科院生物物理所把30纳米的染色质结构搞清楚了,文章也发表在《科学》上,也是用冷冻电镜技术把结构搞清楚的,其重要性与这次剪接体结构的阐明不相伯仲,这些研究成果谁能获诺奖,从概率来说还要看运气,还要看诺奖提名委员会成员是否对这些研究成果有兴趣。

  (作者系中科院上海生化与细胞研究所研究员)

 

(http://news.tsinghua.edu.cn)