• 免费服务热线
  • 400-065-6886
  • 电话:86(0)512-6295 9990
  • 传真:86(0)512-6295 9995
新闻中心

Nature News:人类基因组中,研究者最爱的基因TOP10大揭秘

发稿时间:2017-11-29来源:天昊生物

 

 

11月22日,Nature News发布了一篇有关数据挖掘的有趣的文章。

 

Peter Kerpedjiev是一位软件工程师,但受过一些生物信息学方面的培训。在他攻读博士学位期间,因为需要一个遗传学速成课程,Kerpedjiev便好奇一个问题“如果我想和遗传学专业的人有一场看起来自己特别专业的对话,我需要了解哪些基因?”。

出于软件工程师对数据的敏感性,Peter立即想到了Pubmed这一庞大的数据库。从2002年开始,美国国家医学图书馆(NLM)一直在PubMed数据库中的文章进行信息标记Kerpedjiev提取了所有标记为描述基因或其编码蛋白质的结构,功能或位置的论文,进行了一些有趣的可视化信息展示。


  • TOP10基因


          通过记录排序,Kerpedjiev整理出如下的榜单人类基因组被研究最多的基因Top10


这个名单的榜首,他发现是一个叫TP53的基因。三年前,Kerpedjiev首先做了有关TP53的分析,他发现研究人员在约6600份论文中仔细研究了TP53基因或其编码蛋白p53。现在,这个数字已经达到了8,500个左右。平均来看,每天就有两篇描述TP53基础生物学新细节的论文发表当然,这个基因成为榜首对生物学家来说都在意料之中。该基因是一种肿瘤抑制因子,被广泛称为基因组的守护者。它在大约一半的人类癌症中突变。马里兰州巴尔的摩市约翰霍普金斯大学医学院癌症遗传学家Bert Vogelstein说:个榜单揭示了它的持久力。他说,在癌症中,没有更重要的基因

但再让我们看看榜单里其它基因的功能,就有很多意料之外的出现了。Kerpedjiev现在是马萨诸塞州波士顿哈佛医学院(Harvard Medical School)研究基因组数据可视化的博士后,他也说:“这个列表令人惊讶,有些基因是可以预测的,有些基因则完全出乎意料。


 


在人类基因组中大约20,000个蛋白质编码基因,而其中100占据了NLM标记的四分之一以上的论文。这意味着,很多基因都是被冷漠对待的。英国剑桥大学(University of Cambridge)的科学史家海伦·安妮·库里(Helen Anne Curry)表示:这揭示了我们不了解还有很多,因为我们不去研究它。


  • 基因研究界的“时尚风潮”


 

1. 不同时期,有不同的基因引领“潮流”。20世纪80年代,血红蛋白(haemoglobin)的编码基因是血液疾病,遗传学会议的讨论热点。但随着研究人员掌握测序和操作DNA的新技术,他们开始转向其他基因和疾病,其中包括当时主要见于男同性恋者的一种神秘感染疾病

2. 1983年发现艾滋病是艾滋病的原因之前,临床免疫学家,例如大卫·克拉茨曼(David Klatzmann)就表示我对这些患者没有T4细胞感到震惊。他在细胞培养实验中发现HIV似乎选择性地感染和破坏这些细胞,问题是:病毒如何进入细胞Klatzmann推断,免疫学家用来定义这组细胞的表面蛋白(后来称为CD4)也可以作为HIV进入细胞的受体。后来证明,的推断是正确的后续三年内,CD4是生物医学文献中的出现频率最高基因。它从1987年到1996年一直保持这样的状态,这个时期占了NLM所有标签的1-2%。

3. 九十年代初,TP53已经开始登上历史舞台。但在它爬到人类基因阶梯顶端之前的几年时间,一种名为GRB2的鲜为人知的基因却是研究的焦点。当时,研究人员开始确定与细胞通讯有关的特定蛋白质的相互作用。由于细胞生物学家Tony Pawson的开创性工作,科学家们知道一些小的细胞内蛋白质含有一个称为SH2的模块,它可以与细胞表面的活化蛋白质结合并将信号传递给细胞核。1992年,位于康涅狄格州纽黑文的耶鲁大学医学院的生物化学家约瑟夫·施莱辛格(Joseph Schlessinger)指出,由GRB2  - 生长因子受体结合蛋白2编码的蛋白质就是这个接力点。它包含一个SH2模块以及两个激活参与细胞生长和存活的蛋白质的结构域。“这是一个分子媒介,”施莱辛格说。GRB2之所以受人关注,部分是因为GRB2“是信号传导级联的两个部分之间的第一个物理连接”,加州圣地亚哥州立大学的生物化学家Peter van der Geer说。此外,“它涉及细胞调控的许多不同方面”。但在TOP10基因中,GRB2又是一个异常值。这不是疾病的直接原因;也不是药物靶点,这也许可以解释为什么它在“火爆期”是短暂的。泰晤士报卡罗林斯卡研究所(Karolinska Institute),皮埃尔和玛丽居里大学(Pierre and Marie Curie University)的TP53长期研究员Thierry Soussi说:“一些冉冉升起的新星因为没有临床价值而快速倒下。具有持久力的基因通常表现出吸引资助机构支持的治疗潜力。Soussi说。“基因的重要性与其临床价值有关,这显而易见”。

4. 1979年已经确定了TP53基因编码p53。然而,TP532000年左右才成为研究最多的基因。它与许多主宰生物学研究的基因一样,在最初的发现之后并没有得到正确的理解。起初,癌症研究界把它误认为癌基因 - 当癌症突变时,它驱动了癌症的发展。直到1989Vogelstein实验室的研究生Suzanne Baker才发现,它实际上是一种抑癌剂。

5. 人类对癌症的研究也使得TNF基因获得了亚军,成为即TP53之后最受关注的人类基因之一,在NLM数据中有超过5,300次被引用(参见“Top基因”)。它编码一种蛋白质 - 肿瘤坏死因子 - 因其能杀死癌细胞而于1975年命名。但是抗癌作用并不是TNF的主要功能。当在人体中测试时,TNF蛋白的治疗形式是高度毒性的。

  •      其它物种的基因组明星基因

 

 

美国国家医学图书馆跟踪了数十种物种的基因,包括小鼠,苍蝇和其他重要的模式生物,以及病毒。从所有物种的基因来看,在过去的50年中,100个研究最多的基因中有超过三分之二是人类基因。但是,一些非人类基因也在名单上排名非常靠前。通常,这些与人类健康有明确的联系,如TP53的小鼠版本,或env,编码参与进入细胞过程的包膜蛋白的病毒基因。

 

 

一个基因之所以比别的基因更受关注,融合了生物学,社会压力,商业机会和医疗需求等多方面的因素。但是,一旦它进入这个所谓“明星阵列”,英国利兹大学(University of Leeds)的科学史学家格雷戈里·拉迪克(Gregory Radick)说:“这些基因会被认为是更保险的下注目标,除非发生条件改变”。现在的问题是条件如何改变。什么样的新发现可能会把一个新的基因送上Top列表 - 并将今天的顶级基因从list上剔除呢?

 

1. 

 

Copyright © 2012-2023 天昊基因科技(苏州)有限公司    All Rights Reserved    苏ICP备17064027号-1