Database design

欢迎来到数据库设计！建立稳固的基石

各位未来的计算机科学家们，大家好！这一章的内容极其重要。设计数据库就像规划一座稳固摩天大楼的结构——如果地基不牢，整座建筑最终都会倒塌！

在这里，我们将学习如何通过表（Tables）、字段（Fields）和特殊的“键”（Keys）来高效地组织数据，确保数据准确且易于管理。如果“键”和“关系”这些术语听起来有些复杂，别担心，我们将用简单、日常的例子来拆解它们。

为何良好的设计至关重要

一个设计良好的数据库可以节省空间、确保准确性，并让你能快速找到所需信息。我们设计的主要目标是消除数据冗余（Data Redundancy）。

核心要点： 好的设计 = 高效 + 准确。

1. 构建模块：表与字段

关系型数据库将信息存储在表（Tables）中（有时也称为实体/Entities）。你可以把表想象成特定类别的事务，例如“学生”、“书籍”或“订单”。

字段（属性/Attributes）

表中的每一列都称为字段（Field）（或属性/Attribute）。字段定义了我们要为该实体存储的具体信息片段。

示例表： 学生 (Students)
示例字段： 学生ID (StudentID)、名字 (FirstName)、姓氏 (LastName)、出生日期 (DateOfBirth)、家庭住址 (HomeAddress)

记录（元组/Tuples）

表中的每一行都是关于某一个特定项目或人员的完整数据集合，这被称为记录（Record）或元组（Tuple）。

快速回顾：组件

表（实体）： 整个类别（例如：*客户*）。
字段（属性）： 一列；特定的一条数据（例如：*姓名*）。
记录（元组）： 一行；关于某一个项目的所有数据（例如：*第45号客户的具体详细信息*）。

2. 必备安全系统：键（Keys）

为了将表连接在一起并确保每条记录都是唯一的，我们使用称为键（Keys）的特殊字段。这可以说是数据库设计中最重要的概念！

A. 主键（Primary Key, PK）

主键（PK）是一个（有时是多个字段的组合）能够唯一标识表中每一条记录的字段。没有两条记录可以具有相同的主键值，且它不能为空（必须是 NOT NULL）。

类比： 主键就像你的护照号码或唯一的学生证号。没有其他人拥有它，你需要它来证明自己的身份。
示例： 在“产品”表中，主键可能是 ProductID（产品ID）。在“学生”表中，它就是 StudentID（学生ID）。

你知道吗？ 由两个或多个字段组合而成的主键被称为复合键（Composite Key）。

B. 外键（Foreign Key, FK）

外键（FK）是一个表中的字段，它引用（或“借用”）了另一个表的主键。外键是将不同表连接在一起、建立关系的关键纽带。

如果这听起来有点烧脑，不用担心！可以这样理解：

我们有一个 班级 (Classes) 表（主键是 ClassID）。
我们有一个 学生 (Students) 表（主键是 StudentID）。
为了说明一个学生属于哪个班级，我们必须将 ClassID 放入 学生 (Students) 表中。
在学生表中，此时 ClassID 就是外键。

记忆小技巧：
Primary Key (主键) = Personal (个人的)，Keeps unique (保持唯一)。
Foreign Key (外键) = For Konnecting (用于连接到另一个表)。

3. 建立连接：数据库关系

使用外键的全部意义在于定义不同表中的数据如何相互关联。这对于避免冗余至关重要。

A. 一对一 (1:1)

表A中的一条记录与表B中的且仅有一条记录相关联，反之亦然。

示例： 一名员工被分配且仅分配一辆公司用车。
如何创建： 将一个表的主键作为外键包含在另一个表中。（这种关系很罕见，因为如果数据真的是 1:1，通常直接放在一张表里就行了。）

B. 一对多 (1:M)

这是最常见且最重要的关系。表A中的一条记录可以与表B中的多条记录相关联。

示例： 一名客户可以下多个订单。（客户是“一”的一方；订单是“多”的一方）。
如何创建： 将“一”方的主键（例如 CustomerID）作为外键放置在“多”方的表中（例如订单表）。

常见错误警示！外键放在哪里？

学生们经常在 1:M 关系中搞不清外键该放哪儿。

规则： 外键永远放在关系的 “多” (Many) 一方。

思考：订单需要知道是谁下的单，但客户记录不需要列出他们下过的每一笔订单（那会导致冗余！）。

C. 多对多 (M:M)

表A中的一条记录可以与表B中的多条记录相关联，表B中的一条记录也可以与表A中的多条记录相关联。

示例： 许多学生可以选修多门课程，许多课程也包含许多学生。
问题： 你不能在 M:M 关系中直接链接两个表，因为这会导致大量数据重复。

分步解决方案：连接表 (Linking Table)

为了解决 M:M 问题，我们必须引入第三张表，通常称为连接表 (Linking Table)（或中间表/Junction Table）。这张表将 M:M 关系拆解为两个单独的 1:M 关系。

创建表A（学生）和表B（课程）。
创建一张新的连接表（例如：选课/Enrolment）。
连接表必须包含两个字段：StudentID（来自学生表的外键）和 CourseID（来自课程表的外键）。
连接表的主键是这两个外键的组合（复合键）。

结果： 学生 (1) 对应选课 (M)。课程 (1) 对应选课 (M)。问题解决！

4. 处理糟糕的设计：数据冗余

设计带有链接表的数据库的主要目的就是为了避免数据冗余。

什么是数据冗余？

数据冗余意味着在数据库中多次存储相同的数据片段。

错误示例： 如果你有一个订单表，并且在每一条订单记录中都填入客户的全名和地址。

冗余引起的问题

如果你允许冗余存在，数据库将会遭遇几个严重的问题，统称为数据异常 (Data Anomalies)：

1. 浪费空间：

为同一个客户存储 500 次相同的地址，远比在客户表中只存一次地址，然后在订单表中通过外键（CustomerID）引用 500 次要占用多得多的存储空间。

2. 更新异常（不一致性）：

这是最危险的问题。如果客户搬家了，你必须在几百个地方（他们所有的订单）更新地址。如果你漏掉了一个，数据就会变得不一致——不同的记录显示同一个人拥有不同的地址。

当表被正确链接时（使用外键），你只需在一个地方（客户表）更新地址，所有链接的订单记录都会自动使用正确、更新后的信息。

3. 插入异常：

有时在没有相关联的数据前，你无法添加新的重要数据。

核心要点： 优秀的数据库设计利用关系（主键/外键）确保数据只存储一次，从而防止不一致。这就是数据完整性 (Data Integrity) 的定义。

章节总结：数据库设计检查清单

你现在已经掌握了数据库设计的基础知识！在构建表结构时，请务必牢记这些核心概念：

识别你的实体（表）。
确定每个实体所需的具体信息（字段）。
确保每个表都有一个唯一的主键 (PK)。
使用外键 (FK)连接表，确保外键始终指向另一个表中的主键。
尽可能将关系结构化为一对多 (1:M)，并将外键放在“多”的一方。
使用连接表来处理多对多 (M:M)关系。
目标是消除数据冗余并确保高度的数据完整性。

你做到了！带着对构建强大数据库所需结构的理解，继续学习下一章吧。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。