欢迎来到基因组计划的世界!

在本章中,我们将探讨科学家如何“阅读”生物体的完整遗传密码。想象一下,如果你拥有一份人类、细菌或果蝇的完整说明书,那会是什么样子?这就是所谓的基因组计划(genome project)!如果这听起来像科幻小说,别担心,我们会将其拆解,一步步带你了解它为什么有用以及它是如何运作的。

1. 到底什么是基因组(Genome)和蛋白质组(Proteome)?

在深入研究这些计划之前,我们需要先厘清两个听起来相似但意义截然不同的“大”词:

基因组(Genome):这是细胞或生物体中整套基因的集合。它是储存在 DNA 中的蓝图,也是生物体的总司令部。
蛋白质组(Proteome):这是指细胞在特定时间内能够产生的所有蛋白质的范围

图书馆类比:
你可以把基因组想象成一个庞大的图书馆,里面包含了该生物体有史以来写下的每一本书(基因)。而蛋白质组就像是从中选出的一批特定书籍,它们正被拿来阅读并用于建造这座“建筑”(生物体)。

快速复习:基因组是潜能(可能建造出什么),而蛋白质组则是现实(实际上正在建造什么)。

2. 简单生物:轻松获胜

科学家最初是从测序简单生物(如原核生物,即细菌)的基因组开始的。由于这些生物结构简单,它们在 DNA 和蛋白质之间提供了“直接链接”。

为什么细菌更容易处理?

在大多数原核生物中,几乎没有“多余”的 DNA。它们的大部分 DNA 都直接编码蛋白质。这意味着,如果你知道了基因组,就很容易推算出其蛋白质组

现实应用:疫苗

通过对危险细菌的 DNA 进行测序,我们可以识别出其抗原(位于细菌表面的蛋白质)。
第一步:对细菌的基因组进行测序。
第二步:找出编码表面蛋白质(抗原)的基因。
第三步:利用这些蛋白质来制造疫苗。这能帮助我们的免疫系统在生病之前就认出这些“坏蛋”!

重点总结:在简单生物中,基因组 = 蛋白质组(基本上如此)。这使得寻找医疗用途的抗原变得很容易。

3. 复杂生物:情况复杂多了!

当我们转向人类等复杂生物(真核生物)时,“一个基因 = 一种蛋白质”的规则就开始失效了。了解人类基因组并不能直接自动告诉我们人类的蛋白质组。

障碍所在

我们无法轻易将复杂基因组转化为蛋白质组,主要有两个原因:
1. 非编码 DNA(Non-coding DNA):我们 DNA 中有很大一部分根本不编码蛋白质。事实上,约 98% 的人类基因组是非编码的!
2. 调节基因(Regulatory Genes):这些是“大老板”基因,负责指挥其他基因何时开启或关闭。它们本身不制造结构性蛋白质,但它们控制着整个流程。

食谱类比:
想象一本食谱,其中 100 页全是关于作者家猫的故事,只有 2 页是真正的食谱。如果你只看书的厚度(基因组),你会以为里面有很多食物(蛋白质),但大部分其实都只是“额外”信息(非编码 DNA)或关于如何使用炉子的操作指南(调节基因)。

你知道吗?人类基因组计划是一项巨大的国际合作项目,历时 13 年,于 2003 年完成。它绘制了我们 DNA 中全部 30 亿个“字母”的地图!

重点总结:在复杂生物中,由于非编码 DNA 和调节基因的存在,蛋白质组很难被预测

4. 现今如何进行测序?

在早期,测序过程缓慢、依赖人工且非常昂贵。然而,技术进步得极其迅速。

持续更新:科学家不断发现读取 DNA 的更快方法。
自动化:今天,我们使用可以在极短时间内对数百万个碱基进行测序的自动化机器。这通常被称为“高通量测序(High-Throughput Sequencing)”。

常见误区:别以为测序技术自人类基因组计划以来一直没变。现在的技术成本更低、速度更快,让我们能够为个人进行 DNA 测序,实现“个性化医疗”。

总结检查清单

你是否能解释:
• 基因组与蛋白质组之间的区别?
• 为什么简单生物的基因组被用于制造疫苗?
• 为什么与细菌相比,人类基因组转化为蛋白质组的难度高得多?
• 测序速度随时间发生了怎样的变化?

如果 98% 的非编码 DNA 听起来很奇怪,别担心——生物学家曾经称其为“垃圾 DNA(junk DNA)”,但我们现在发现它在身体运作中发挥着巨大作用!