人类基因有1/5不是“真实”的

人气 635

【大纪元2018年09月19日讯】(大纪元记者晨曦编译报导)科学家们发现,人类基因组中包含的“真实”基因,或曰蛋白质编码基因,比以前我们所认为的要少得多,这将会给生物医学研究带来重大改变。

早在上世纪九十年代初,科学家们就开始着手绘制人类基因组的整个DNA序列。这项研究被称作“人类基因组工程”,其目的是为了探究基因与疾病的联系,并了解基因组各种元素的功能与结构,例如哪些基因编码蛋白质、哪些因素调节基因表达等。

该工程初步预测人类有40,000个基因可以给蛋白质编码,而蛋白质这种大分子对身体组织和器官的良好运作起着至关重要的作用。然而,当这一项目在2003年接近尾声时,对编码蛋白质的基因数量的估计已被降至约20,000~25,000个。

从那时起,科学家们就开始努力确认最终的蛋白质组——即可以由基因表达的蛋白质总数——并且一直致力于了解这些蛋白质的基因表达如何在几种疾病中发生突变。

为此,由位于西班牙马德里的西班牙国家癌症研究中心生物信息学部门的Michael Tress领导的一个国际研究团队,开始对三个主要蛋白质组数据库中被认为可编码蛋白质的基因进行了检查。他们的研究结果发表在《核酸研究》(Nucleic Acids Research)期刊上。

至少二千个是“伪基因”

团队成员将三个蛋白质序列和基因标注数据库中的蛋白质进行了对比,这三个数据库分别为GENCODE/Ensembl、RefSeq和UniProtKB。

团队发现,被列出的总数为22,210的蛋白质编码基因中,只有19,446个同时包含在三个数据库中。然后,他们将这2,764个基因的差异放大,检查了实验证据和标注中可获得的信息。有证据表明,这些基因中的大多数都是非编码基因,或叫做伪基因。

团队还发现,还有另外1,470个基因没有蛋白质编码基因的功能特征或典型演化,但在三个数据库中却同时都被列为蛋白质编码基因。

因此,研究人员相信,这三个参考数据库目前对人类编码基因数量的估算比实际至少多出了2000个,这也使大规模生物医学实验变得复杂。确定哪些是潜在的非编码基因非常困难但至关重要,因为人类参考蛋白质组是大多数基础研究和大规模生物医学课题的支柱。

未来的研究方向

该团队获得的证据表明,人类或许只有约19,000个编码基因,但具体都是哪些基因,我们依旧不得而知。这一发现将给生物医学领域带来重大突破,进一步的研究工作也正在进行中。

“我们已经对其中的许多基因进行了详细分析。”Tress解释说:“已经有三百多个基因被归类为非编码基因。”◇

责任编辑:朱涵儒

相关新闻
能不能跻身拔尖1% 恐得看基因
有肥胖基因别难过 运动节食照样能瘦
颜丹:“转基因检测中心造假”说明了什么?
吸烟损伤基因 戒烟后仍影响30年以上
如果您有新闻线索或资料给大纪元,请进入安全投稿爆料平台
评论