Using genome projects

欢迎来到基因组计划的世界！

在本章中，我们将探讨科学家如何“阅读”生物体的完整遗传密码。想象一下，如果你拥有一份人类、细菌或果蝇的完整说明书，那会是什么样子？这就是所谓的基因组计划（genome project）！如果这听起来像科幻小说，别担心，我们会将其拆解，一步步带你了解它为什么有用以及它是如何运作的。

1. 到底什么是基因组（Genome）和蛋白质组（Proteome）？

在深入研究这些计划之前，我们需要先厘清两个听起来相似但意义截然不同的“大”词：

• 基因组（Genome）：这是细胞或生物体中整套基因的集合。它是储存在 DNA 中的蓝图，也是生物体的总司令部。
• 蛋白质组（Proteome）：这是指细胞在特定时间内能够产生的所有蛋白质的范围。

图书馆类比：
你可以把基因组想象成一个庞大的图书馆，里面包含了该生物体有史以来写下的每一本书（基因）。而蛋白质组就像是从中选出的一批特定书籍，它们正被拿来阅读并用于建造这座“建筑”（生物体）。

快速复习：基因组是潜能（可能建造出什么），而蛋白质组则是现实（实际上正在建造什么）。

2. 简单生物：轻松获胜

科学家最初是从测序简单生物（如原核生物，即细菌）的基因组开始的。由于这些生物结构简单，它们在 DNA 和蛋白质之间提供了“直接链接”。

为什么细菌更容易处理？

在大多数原核生物中，几乎没有“多余”的 DNA。它们的大部分 DNA 都直接编码蛋白质。这意味着，如果你知道了基因组，就很容易推算出其蛋白质组。

现实应用：疫苗

通过对危险细菌的 DNA 进行测序，我们可以识别出其抗原（位于细菌表面的蛋白质）。
• 第一步：对细菌的基因组进行测序。
• 第二步：找出编码表面蛋白质（抗原）的基因。
• 第三步：利用这些蛋白质来制造疫苗。这能帮助我们的免疫系统在生病之前就认出这些“坏蛋”！

重点总结：在简单生物中，基因组 = 蛋白质组（基本上如此）。这使得寻找医疗用途的抗原变得很容易。

3. 复杂生物：情况复杂多了！

当我们转向人类等复杂生物（真核生物）时，“一个基因 = 一种蛋白质”的规则就开始失效了。了解人类基因组并不能直接自动告诉我们人类的蛋白质组。

障碍所在

我们无法轻易将复杂基因组转化为蛋白质组，主要有两个原因：
1. 非编码 DNA（Non-coding DNA）：我们 DNA 中有很大一部分根本不编码蛋白质。事实上，约 98% 的人类基因组是非编码的！
2. 调节基因（Regulatory Genes）：这些是“大老板”基因，负责指挥其他基因何时开启或关闭。它们本身不制造结构性蛋白质，但它们控制着整个流程。

食谱类比：
想象一本食谱，其中 100 页全是关于作者家猫的故事，只有 2 页是真正的食谱。如果你只看书的厚度（基因组），你会以为里面有很多食物（蛋白质），但大部分其实都只是“额外”信息（非编码 DNA）或关于如何使用炉子的操作指南（调节基因）。

你知道吗？人类基因组计划是一项巨大的国际合作项目，历时 13 年，于 2003 年完成。它绘制了我们 DNA 中全部 30 亿个“字母”的地图！

重点总结：在复杂生物中，由于非编码 DNA 和调节基因的存在，蛋白质组很难被预测。

4. 现今如何进行测序？

在早期，测序过程缓慢、依赖人工且非常昂贵。然而，技术进步得极其迅速。

• 持续更新：科学家不断发现读取 DNA 的更快方法。
• 自动化：今天，我们使用可以在极短时间内对数百万个碱基进行测序的自动化机器。这通常被称为“高通量测序（High-Throughput Sequencing）”。

常见误区：别以为测序技术自人类基因组计划以来一直没变。现在的技术成本更低、速度更快，让我们能够为个人进行 DNA 测序，实现“个性化医疗”。

总结检查清单

你是否能解释：
• 基因组与蛋白质组之间的区别？
• 为什么简单生物的基因组被用于制造疫苗？
• 为什么与细菌相比，人类基因组转化为蛋白质组的难度高得多？
• 测序速度随时间发生了怎样的变化？

如果 98% 的非编码 DNA 听起来很奇怪，别担心——生物学家曾经称其为“垃圾 DNA（junk DNA）”，但我们现在发现它在身体运作中发挥着巨大作用！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。