主题:【25个科学问题征文】为什么人类的基因数目这么少? -- 水风
当上个世纪九十年代末期人类基因组计划初步完成以后,科学家们终于可以从组成人类基因组的30亿个碱基对中找出所有的基因。关于基因的数目,大家众说纷纭。根据十年前的通常观点,我们至少需要10万个基因,才能保证体内如此众多不同类型的细胞可以良好的执行他们的功能。(虽然最终的确切数目还没有得到) 但是,目前所知道人类基因的大概数目,只有2万5千个。这个数目,跟一种不起眼的开着小花的植物―拟南芥的基因数目差不多,只不过比简单的用来喂鱼的线虫,Caenorhabditis elegans,稍微多一点。
自上而下的物种名称是:果蝇,线虫,人,拟南芥,河豚和水稻。
这个让人吃惊的事实也验证了遗传学家们一种逐渐流行的观点:我们和其他哺乳动物的基因组要远比我们曾经以为的要复杂和灵活的多。老版本的一个基因一个蛋白的观点已经逐渐被人抛弃。现在已经清楚,很多基因产生的远远不止一个蛋白。各种调控基因,转录产生的RNA, DNA上面的非编码序列, 甚至很多化合物和基因组自身的结构变化都可以影响基因表达的时期,位置甚至是表达的方式。找出如此众多的调控因素是如何协调基因的表达是目前生物学家们面对的主要挑战之一。
在过去的几年中,科学家们发现一种叫做选择性剪切的机制是人类基因组用如此少的基因产生出如此众多的多样性的一个主要原因。人类的基因包括非编码的序列和编码序列―外显子。在某些基因中,不同的外显子的组合会在不同的时期被激活,每一种组合都会产生一种蛋白。选择性剪切长久以来一直被认为是一种非常罕见的现象,但是研究者们现在宣称至少在过半,有些人甚至说几乎全部的人类基因,(我知道的比例是>80%的基因)都有或多或少的选择性剪切发生。这个发现虽然在原理上可以解释人类基因数目虽少,可是依然可以产生如此众多的,几十万甚至上百万的蛋白种类。但是,如何在适当的时期和位置,决定适当的剪切机制依然是一个谜。(这里原文是说转录的过程中外显子的决定,我认为不妥,特此更正)
另外一个难题是决定哪个基因,或者是哪些基因将在特定的时期和位置被启动和关闭转录。研究者们发现,基因的转炉调控是非常复杂的过程,往往需要上百种蛋白协同作用。在这些蛋白里面,有的通过调控DNA的甲基化和乙酰化,有的通过调整DNA的构型和构象(这点作者在原文的下一段提到),有的通过招徕转录机器,有的通过稳定转录机器的工作或者促进其起始,(这两点作者没有提到)来直接调控基因的转录。还有的蛋白特异性的决定转录起始的位点,从而使这个基因可以在特定的时期和位置从多个转录起始位点中选择合适的。但是研究者们目前还不清楚,这种转录调控机制是如何跟选择性的剪切机制结合到一起,来共同调节基因表达的。(这一段作者好像自己也不是很清楚,讲得很含糊,所以我索性直接抛开他的原作,把事情讲的条理了一点)
染色质结合蛋白和RNA在基因表达调控中的作用,在过去的十年中逐渐受到了众多研究者们的重视。染色质结合蛋白直接跟DNA结合在一起,控制了DNA高级结构的组装,被认为跟细胞核内的高级结构调控有着密不可分的关联。(呵呵,作者又没提到点子上,我只好给他补充一下了)DNA或者称为染色质的高级结构的细微变化,直接影响到DNA上面的基因的空间位置,而这些空间位置则直接决定了转录机器能否大量快速的接近这些基因。从而在高级结构层次上对基因表达进行调控。目前这方面的工作刚刚开始,其中的具体机制还不是很清楚。(摇头,这个作者阿,)
许多小于30个碱基的小RNA分子,目前已经被证明在多个基因的表达调控中起着重要的作用。在过去的五年中,microRNA(小RNA)和小的核内RNA成为了RNA研究的焦点。这些RNA可以直接关闭或者改变多种基因的表达。在多细胞生物中,这些RNA被发现是细胞分化决定中非常重要的一些调控因素。一旦缺失或者突变,将会造成很多种发育缺陷和疾病。(呵呵,有时我真的怀疑这个作者是不是有个习惯老是把话给说一半,讲了开头就TJ了)
microRNA(小RNA)的调控机制是最近几年才刚刚被发现的,最初是发现一个基因缺失,造成了多个基因的过量表达。大家找来找去,最后发现,调控着多个基因表达的,不是蛋白,而是一个20几个碱基长的小RNA。接着就发现了多个其它类似的小RNA。最初的发是在小鼠中得到的,然后在多种的哺乳类中也陆续发现了类似的小RNA。
这个发现进一步强化了RNA在整个生命过程中的重要性。即所有的蛋白表达过程,不仅仅翻译的整个过程依靠三种主要的RNA,其翻译调控过程也是由RNA参与。而之前的选择性剪切也是主要由核内的小RNA执行的。但是,当科学家们把目光投向低等的脊椎动物和非脊椎动物的时候,却发现很多种在哺乳类中普遍存在的小RNA调控机制在那些生物中已经缺失了。
让我们重新回到我们讨论的主题,为什么人类和哺乳类,会利用大量保留下来的RNA机制,来灵活的利用有限的基因,以达到那些另外的低等生物只有利用大量基因才能达到的功能,甚至还要复杂先进一些。而低等动物中这些调控机制的缺失,是否也是低等生物中,功能和基因数目的比例减少的一个主要原因呢?如果是那样,是否是愈保守的,反而愈先进呢?(以上两段,纯属个人议论,作者的观点绝对是陈词滥调,没有什么新鲜的,不过为了尊重版权,我还是勉为其难的翻译一下好了)
研究者们花费了大量的精力来研究这众多的机制。通过比较具有不同进化地位的生物间的基因组,研究者们试图找出保守的调控序列并进一步找出如选择性剪切等调控的机制。在小白鼠中通过增减调控序列来操作RNA的实验以及计算机模拟研究应该对我们了解这些机制提供很大的帮助。但是中心问题估计在很长的时间内难以得到解决。这个问题就是:这些方面是如何的协同工作从而产生了我们人类?
本帖一共被 5 帖 引用 (帖内工具实现)
手里的精片片捂得已经发热了。
开始提问:文中提到了人类的基因数目并不比其它物种高很多,那么基因的‘平均碱基对数目’比较如何呢?人类的是否单个基因会更大一些呢?
作者看来是个半瓶子醋,文章恐怕是东拉西凑来的,没有什么新观点
干得好
人家说了这是翻译来的
Caenorhabditis elegans is a microscopic (~1 mm) nematode (roundworm) that normally lives in soil.
I do not think it is "简单的用来钓鱼的线虫".
How do you think?
译者加的注释都挺好的
原作者好像是个编辑
作为这样的介绍型文章,这个已经写的很好了。只可惜结论部分讨论的太浅了,只是人云亦云了一下,遗憾。
已改正。多谢指正。
来看看蛋白质,现在人们已经知道的蛋白质的数目为12000个,而被广泛研究,并且确认蛋白质功效的数目为300到500种。已经知道的蛋白质结构不足25%, 同时三分之一的蛋白质由于亲水性太强,不可能得到其三维立体结构。
蛋白质的已知3维立体结构为空气中稳定结构,人类对于在体内,或是在缓冲溶液里的蛋白质结构几乎一无所知。
作为专业领域的一则新闻,做得粗糙了些。
改行有些年头了,看到这个倍感亲切,以后常来。
看来河里学生物的人不少。