欢迎来到第18章:人工智能 (AI)

你好!准备好探索计算机科学中最令人兴奋且发展最迅速的领域之一:人工智能 (Artificial Intelligence, AI)。人工智能致力于创建能够模拟人类智能的计算机系统,例如学习、解决问题、决策以及理解语言。

从 Netflix 的推荐系统到手机上的语音助手,人工智能已经深度融入了我们的生活。在本章中,我们将研究 AI 系统如何应对复杂的问题,以及最关键的——它们是如何学习和进化的。

如果有些概念看起来比较抽象,请不要担心;我们将通过清晰的类比将它们拆解,并与你的考试大纲要求直接挂钩!


1. 使用图(Graph)解决 AI 问题

在计算机科学中,许多问题(例如寻找最佳路线或解谜题)都可以使用一种称为(Graph)的数学结构来建模。

图中 AI 的目的与结构

想象一张地铁线路图。这张图是 AI 中所用图结构的完美类比:

  • 节点 (Nodes 或 Vertices): 表示单个点、状态或位置。(例如:地铁站)
  • 边 (Edges 或 Arcs): 表示节点之间的连接。它们通常具有关联的成本或权重。(例如:连接两个站点的地铁线路,权重可能是旅行时间或距离。)

图如何辅助 AI: AI 使用图来表示状态空间(State Space)——即系统可以采取的所有可能状态和动作的集合。搜索这个图可以让 AI 找到到达目标状态的最优动作序列。

搜索算法:Dijkstra 算法与 A* (A-Star) 算法

当 AI 需要在图中的两个节点之间找到最短或成本最低的路径时,它会使用搜索算法。

Dijkstra 算法

目的: 基于边的权重,找到从起始节点到图中所有其他节点的最短路径。该算法非常可靠。

类比: 想象使用一个标准的地图应用,它通过从起点开始向外检查每一条连接的道路路段,直到到达目的地来严格计算距离。它是详尽无遗的,且保证能找到绝对最短的距离。

A* (A-Star) 算法

目的: A* 同样用于寻找最短路径,但它通常比 Dijkstra 算法快得多、效率更高,尤其是在大型图中。

诀窍:启发式函数 (Heuristic)

A* 使用一种称为启发式函数的特殊函数。启发式函数本质上是一个“有根据的猜测”,是对到达目标剩余成本的估计。它帮助算法优先考虑看起来最有希望的路径。

  • 如果 Dijkstra 是盲目地向所有方向搜索,那么 A* 会智能地将搜索重点集中在目标方向上,从而节省计算开销。
  • A* 通过结合已消耗的实际成本 (g) 和剩余的估计成本 (h) 来计算其优先级:
    总估计成本 = \(g + h\)

你知道吗? A* 被广泛用于电子游戏的敌人寻路和现代 GPS 系统中,因为它能非常迅速地找到最优路径。


快速回顾:图搜索

  • 图: 节点和加权边表示状态和转换。
  • Dijkstra: 找到到达所有节点的实际最短路径。
  • A*: 通过使用启发式函数(估计值)高效地找到最短路径。


2. 机器学习:学习的类别

机器学习 (Machine Learning, ML) 是 AI 的一个子领域,系统无需被显式编程规则,即可直接从数据中学习。机器学习不是编写“如果 X 则 Y”的代码,而是由机器接收数据并自行学习其中的关系。

机器学习类别

大纲要求你理解机器学习的三大主要类别,它们由数据的呈现方式及系统接收反馈的方式来定义。

(a) 监督学习 (Supervised Learning)

这就像有一位老师或导师指导学习过程。用于训练的数据是已标记的 (labeled),意味着输入数据已经关联了正确的输出或“答案”。

工作原理:

  1. 系统被展示一个输入 (例如:一张苹果的照片) 和正确的标签 (例如:“苹果”)
  2. 系统做出预测。
  3. 系统将预测结果与正确标签进行比较,并计算误差。
  4. 系统调整其内部模型,以减少未来预测时的误差。

常见任务:

  • 分类 (Classification): 预测离散的标签 (例如:这封邮件是垃圾邮件还是正常邮件?)
  • 回归 (Regression): 预测连续的值 (例如:预测明天的气温或房价)
(b) 无监督学习 (Unsupervised Learning)

这是一种没有老师的学习方式。训练数据是未标记的 (unlabeled)。系统的任务是自行探索数据,并发现其中隐藏的模式、结构或关系。

工作原理:

系统接收数据点,并被要求根据相似性对它们进行分组或构建结构。

常见任务:

  • 聚类 (Clustering): 将相似的项目归为一类。 (例如:市场营销公司利用此技术发现购买相似产品的客户群,从而进行精准投放。)

监督与无监督的类比:

  • 监督学习: 你给孩子看 100 张猫和狗的照片,并告诉他们“这是猫,这是狗”。他们学会了对新图片进行分类。
  • 无监督学习: 你给孩子 100 张混杂的图片,让他们把相似的物体分成两堆。他们不知道名字,但会根据共同特征找出类别(猫和狗)。

快速回顾:机器学习类别

  • 监督学习: 使用已标记数据;找到从输入到已知输出的映射。
  • 无监督学习: 使用未标记数据;发现隐藏的结构/模式(聚类)。


3. 高级 AI 与学习方法

在解决高度复杂的问题时——例如处理人类语音或自动驾驶——AI 依赖于强大的数学模型,这些模型主要受到人类大脑的启发。

人工神经网络 (Artificial Neural Networks, ANNs)

ANN 是受大脑生物神经网络结构启发的计算模型。它们是大多数现代机器学习和深度学习系统的基石。

结构:

ANN 由多层相互连接的处理单元组成,称为神经元 (neurons) 或节点。神经元之间的每个连接都有一个数值,称为权重 (weight)。这些权重就是网络通过训练不断调整并“学习”的内容。

  • 输入层 (Input Layer): 接收数据(例如:图像的像素值)。
  • 隐藏层 (Hidden Layers): 执行复杂的计算和特征提取。层数越多,网络越“深”。
  • 输出层 (Output Layer): 提供最终结果(例如:分类结果,如“汽车”或“卡车”)。

深度学习 (Deep Learning, DL)

深度学习其实就是机器学习的一种特定类型,它使用非常深的人工神经网络(即拥有许多隐藏层的网络)。

  • 传统的机器学习可能只有一两层隐藏层;而深度学习可能有几十层。
  • 这种深度使系统能够从原始数据中自动提取越来越复杂的特征。 (例如:在图像处理中,第一层可能检测边缘,下一层检测形状,最终层识别物体。)

为什么要使用深度学习? 它在处理非结构化数据(图像、音频、文本)时表现出色,因为这些数据的特征很难手动定义。

强化学习 (Reinforcement Learning, RL)

强化学习是一种 AI 智能体通过在环境中采取行动并获得奖励 (rewards)惩罚 (penalties)(反馈)来学习决策的方法。

  • 没有训练数据或导师;智能体完全通过试错 (trial and error) 来学习。
  • 目标: 最大化长期的累积奖励。

类比: 教机器人走路。当它走对了,就得到奖励;当它摔倒了,就受到惩罚。最终它会摸索出最优的肌肉动作(动作)序列,以最大化奖励(保持站立)。

应用: 机器人技术、训练 AI 玩国际象棋或围棋等复杂游戏,以及优化工业流程。


快速回顾:高级学习

  • ANN: 以大脑为模型,在神经元之间使用加权连接(权重)。
  • 深度学习: 使用拥有许多隐藏层的 ANN 来处理复杂任务。


4. 训练 AI:反向传播与回归

为了使人工神经网络有效学习,它需要一种机制,根据监督训练过程中犯下的错误来调整其权重。这种机制称为反向传播。

误差反向传播 (Back Propagation)

反向传播是训练 ANN 的主要算法。它的工作原理是计算输出层的误差,并将该误差向后传播到整个网络,以确定每个权重对错误的贡献程度。

分步过程(学习循环):

  1. 前向传播 (Forward Pass): 输入数据一层一层地通过网络,直到生成最终的输出预测。
  2. 误差计算 (Error Calculation): 计算网络预测值与实际正确值(已知标签)之间的差异。这就是误差
  3. 反向传播 (Backward Pass): 误差从输出层向后传播(发送),经过隐藏层,回到输入层。

通过重复这个循环成千上万次,网络的权重会逐渐得到精炼,从而形成一个准确的模型。

记忆辅助: 反向传播是 AI 将错误“归咎”于特定权重的方式,这样它就知道如何修正它们。

机器学习中的回归方法

回归是监督学习中使用的一种基础统计方法。其主要目的是预测

定义: 当 AI 需要预测一个连续值(范围内的数字,而非固定的类别)时,会使用回归方法。

示例:

  • 分类: 预测类别:“这水果是苹果还是香蕉?”(离散输出)
  • 回归: 预测数值:“这个苹果有多重?”或“明天的股票价格是多少?”(连续输出)

在机器学习背景下,回归方法建立自变量(输入)与因变量(我们想要预测的输出)之间的关系。


5. AI 的社会、经济与环境影响

人工智能是一种强大的工具,像任何技术一样,它具有深远的影响。

社会问题

  • 偏差与公平性: AI 系统从数据中学习。如果训练数据包含人类偏差(例如历史上的种族或性别偏见),AI 将在决策中复制甚至放大这些偏差(例如贷款申请或招聘筛选)。
  • 隐私: AI 训练依赖海量个人数据(大数据),引发了关于监控和滥用隐私信息的担忧。
  • 虚假信息: AI 可以创建高度逼真的伪造内容(Deepfakes),威胁信任并导致虚假信息的传播。

经济问题

  • 失业: AI 和自动化可以取代从事常规、重复或复杂分析工作的人类工人(例如工厂工人、某些行政岗位,甚至某些法律研究工作)。
  • 创造新就业: 虽然一些工作消失了,但也创造了新的工作岗位,需要 AI 维护、伦理和数据科学方面的技能。
  • 提高生产力: AI 处理海量数据集和复杂计算的速度远超人类,从而在金融、医疗、物流等行业带来显著的效率提升。

环境问题

  • 能源消耗: 训练大型、复杂的深度学习模型(如大型语言模型)需要巨大的计算能力,导致极高的能源使用和巨大的碳足迹。
  • 优化: 反过来,AI 也可用于优化能源电网、交通流量和制造流程,从而提高整体环境效率。 (例如:使用机器学习预测能源需求以减少浪费。)

作为一名计算专业人员: 考虑这些影响至关重要。像 BCS(英国计算机协会)IEEE(电气电子工程师学会) 这样的伦理机构正在推广伦理准则,以确保 AI 的开发是负责任的。