欢迎来到数据处理的世界!
你好!在本章中,我们将探索信息技术中最重要的部分:数据与数据库 (Data and Databases)。你可以把数据想象成厨房里的原始食材。单独来看,它们可能没什么特别,但只要你正确地处理 (manipulate) 它们,就能创造出非常有用的东西——就像一道美味的佳肴(在我们这里,就是信息 (Information))。
如果一开始觉得有些术语听起来很“科技感”,别担心。我们将通过简单的例子和类比,一步步为你拆解。让我们开始吧!
5.1 数据与信息
在我们开始处理数据之前,必须先了解它究竟是什么,以及它与信息有何不同。
数据与信息的区别
数据 (Data) 是原始的、未经处理的事实和数字。它本身没有意义。
例子:15, 08, 1995。这些仅仅是数字。
信息 (Information) 是经过处理、整理或结构化的数据,使其具备意义和上下文。
例子:“15/08/1995”被标识为“出生日期”。现在它就有意义了!
类比:乐高积木
想象地板上有一大堆散落的乐高积木。这些就是数据。当你按照说明书拼成一座城堡时,那座完成的城堡就是信息。而拼砌城堡的这个过程就是处理 (Processing)。
结构化数据与非结构化数据
并非所有的数据长相都一样。我们通常将其分为两类:
1. 结构化数据 (Structured Data): 这是高度组织化的数据,通常以表格形式(行列)呈现。电脑非常容易搜索和分析这类数据。
例子:包含学生姓名和成绩的电子表格。
2. 非结构化数据 (Unstructured Data): 这是没有预定义格式的数据。电脑很难自动“读取”它们。
例子:照片、视频、社交媒体贴文或手写笔记。
快速复习箱:
- 数据: 原始事实(“食材”)。
- 信息: 处理过的数据(“佳肴”)。
- 结构化: 有条理(就像整理好的档案柜)。
- 非结构化: 无组织(就像乱堆的文件堆)。
重点摘要: 机构希望从数据中提取有意义的信息,因为这能帮助他们做出更好的决策,例如商店观察哪些产品销量最好,以便及时补货。
5.2 结构化数据与数据库
数据库 (Database) 是结构化数据的有序集合。我们使用关系型数据库 (Relational Databases) 将不同的信息片段链接起来。
关系型数据库的结构
要理解数据库,可以想象一个学校档案系统的数字版本:
- 数据表 (Tables): 数据库由一个或多个数据表组成。一个数据表包含关于特定事物(如“学生”或“教师”)的数据。
- 字段 (Fields): 这是数据表中的列。每个字段存放一项具体的信息。
例子:“FirstName”(名字)或“PhoneNumber”(电话号码)。
- 记录 (Records): 这是数据表中的行。一条记录包含关于某个特定项目或人员的所有信息。
例子:名为“Alex”的学生所有详细资料。
理解“键 (Keys)”
键就像是将数据库凝聚在一起的胶水。
1. 主键 (Primary Key): 数据表中每条记录的唯一标识符。两条记录不能有相同的主键。
例子:你的学生编号。即使两个人名字相同,他们的 ID 也是独一无二的!
2. 外键 (Foreign Key): 这是数据表中的一个字段,链接到另一个数据表中的主键。这是我们在数据表之间建立关系 (Relationship) 的方式。
3. 复合键 (Composite Key): 有时候,单一字段不足以成为唯一识别。复合键是指结合两个或多个字段,共同创造出一个唯一标识符。
记忆小贴士:键的技巧
- 主键 (Primary): “头号人物”(主要的 ID)。
- 外键 (Foreign): “外来者”(指向另一个数据表)。
- 复合键 (Composite): “合成”(两样东西混在一起)。
实体与关系
实体 (Entity) 是一个专业词汇,指的是我们正在存储数据的“对象”(例如客户、产品或销售记录)。在数据库中,实体通过关系 (Relationships) 进行“沟通”:
- 一对一 (1:1): 一个人只有一本护照。
- 一对多 (1:M): 一位老师有多位学生。(这是最常见的!)
- 多对多 (M:M): 多位学生选修多门不同的科目。
你知道吗? 我们使用实体关系图 (ERD) 来绘制这些数据表如何相互链接的地图,然后才开始构建数据库。这就像是房子的蓝图一样!
重点摘要: 数据库使用数据表、字段和记录来保持组织,而“键”则用于精确地将所有内容链接起来。
5.3 结构化查询语言 (SQL)
现在数据已经存入数据库了,我们该如何提取出来呢?我们使用 SQL(读作“S-Q-L”或“Sequel”)。SQL 是我们用来与数据库“对话”的语言。
为什么要用 SQL?
SQL 允许我们处理 (manipulate) 数据——这意味着我们可以搜索特定的记录、新增数据、修改现有数据,或者删除不再需要的东西。
常见的 SQL 指令
如果这看起来像一大堆程序代码,别担心——它们其实非常符合逻辑!
1. 寻找数据 (查询 Queries):
我们使用 SELECT 来挑选字段,FROM 来指定数据表,WHERE 来筛选结果。
例子:SELECT Name FROM Students WHERE Grade = 'A';
2. 新增与修改数据:
- INSERT: 在数据表中新增一行(记录)。
- UPDATE (修改): 更改现有的数据。
- DELETE: 永久移除一条记录。(使用时要小心!)
3. 分组与计算:
- COUNT: 计算有多少条记录。
- ORDER BY: 对结果进行排序(A-Z 或由高到低)。
- GROUP BY: 将相似项目分组(例如:显示每个班级有多少学生)。
使用通配符 (Wildcards)
有时候你不知道要找的词确切是什么。我们使用通配符作为“填空题”:
- % (百分号): 代表任意数量的字符。
例子:'S%' 会找到 "Sam", "Sarah", 和 "Steven"。
- _ (下划线): 代表且仅代表一个字符。
例子:'H_t' 会找到 "Hat" 和 "Hot",但不会找到 "Heat"。
链接数据表 (JOIN 与 UNION)
- JOIN: 用于根据相关字段(通常是主键和外键)合并来自两个或多个数据表的数据行。
- UNION: 用于将两个或多个 SELECT 语句的结果集组合到一个大列表中。
常见错误:
学生常忘记在 SQL 语句末尾加上分号 (;)。请把分号想象成数据库世界中句子的“句号”!
重点摘要: SQL 是让我们对数据执行操作的工具。通过 SELECT、INSERT 和 JOIN 等指令,我们能将庞大的数据库变成有用的信息。
最终快速复习
- 数据 (Data) 是原始的;信息 (Information) 是有意义的。
- 关系型数据库使用由键 (Keys) 链接的数据表 (Tables)。
- 主键 (Primary Keys) 是唯一 ID;外键 (Foreign Keys) 用于链接其他数据表。
- SQL 是用于选取、新增、更新和删除数据的语言。
- 通配符 (%) 和 (_) 帮助我们在名称不完整时进行搜索。
你已经读完了“数据处理”笔记!做得好!休息一下,然后试着写一个简单的 SQL 查询来练习一下手感。你一定没问题的!