Artificial Intelligence (AI)

欢迎来到第18章：人工智能 (AI)

你好！准备好探索计算机科学中最令人兴奋且发展最迅速的领域之一：人工智能 (Artificial Intelligence, AI)。人工智能致力于创建能够模拟人类智能的计算机系统，例如学习、解决问题、决策以及理解语言。

从 Netflix 的推荐系统到手机上的语音助手，人工智能已经深度融入了我们的生活。在本章中，我们将研究 AI 系统如何应对复杂的问题，以及最关键的——它们是如何学习和进化的。

如果有些概念看起来比较抽象，请不要担心；我们将通过清晰的类比将它们拆解，并与你的考试大纲要求直接挂钩！

1. 使用图（Graph）解决 AI 问题

在计算机科学中，许多问题（例如寻找最佳路线或解谜题）都可以使用一种称为图（Graph）的数学结构来建模。

图中 AI 的目的与结构

想象一张地铁线路图。这张图是 AI 中所用图结构的完美类比：

节点 (Nodes 或 Vertices)： 表示单个点、状态或位置。（例如：地铁站）
边 (Edges 或 Arcs)： 表示节点之间的连接。它们通常具有关联的成本或权重。（例如：连接两个站点的地铁线路，权重可能是旅行时间或距离。）

图如何辅助 AI： AI 使用图来表示状态空间（State Space）——即系统可以采取的所有可能状态和动作的集合。搜索这个图可以让 AI 找到到达目标状态的最优动作序列。

搜索算法：Dijkstra 算法与 A* (A-Star) 算法

当 AI 需要在图中的两个节点之间找到最短或成本最低的路径时，它会使用搜索算法。

Dijkstra 算法

目的： 基于边的权重，找到从起始节点到图中所有其他节点的最短路径。该算法非常可靠。

类比： 想象使用一个标准的地图应用，它通过从起点开始向外检查每一条连接的道路路段，直到到达目的地来严格计算距离。它是详尽无遗的，且保证能找到绝对最短的距离。

A* (A-Star) 算法

目的： A* 同样用于寻找最短路径，但它通常比 Dijkstra 算法快得多、效率更高，尤其是在大型图中。

诀窍：启发式函数 (Heuristic)

A* 使用一种称为启发式函数的特殊函数。启发式函数本质上是一个“有根据的猜测”，是对到达目标剩余成本的估计。它帮助算法优先考虑看起来最有希望的路径。

如果 Dijkstra 是盲目地向所有方向搜索，那么 A* 会智能地将搜索重点集中在目标方向上，从而节省计算开销。
A* 通过结合已消耗的实际成本 (g) 和剩余的估计成本 (h) 来计算其优先级：
总估计成本 = \(g + h\)

你知道吗？ A* 被广泛用于电子游戏的敌人寻路和现代 GPS 系统中，因为它能非常迅速地找到最优路径。

快速回顾：图搜索

图：节点和加权边表示状态和转换。
Dijkstra： 找到到达所有节点的实际最短路径。
A*： 通过使用启发式函数（估计值）高效地找到最短路径。

2. 机器学习：学习的类别

机器学习 (Machine Learning, ML) 是 AI 的一个子领域，系统无需被显式编程规则，即可直接从数据中学习。机器学习不是编写“如果 X 则 Y”的代码，而是由机器接收数据并自行学习其中的关系。

机器学习类别

大纲要求你理解机器学习的三大主要类别，它们由数据的呈现方式及系统接收反馈的方式来定义。

(a) 监督学习 (Supervised Learning)

这就像有一位老师或导师指导学习过程。用于训练的数据是已标记的 (labeled)，意味着输入数据已经关联了正确的输出或“答案”。

工作原理：

系统被展示一个输入 （例如：一张苹果的照片） 和正确的标签 （例如：“苹果”）。
系统做出预测。
系统将预测结果与正确标签进行比较，并计算误差。
系统调整其内部模型，以减少未来预测时的误差。

常见任务：

分类 (Classification)： 预测离散的标签 （例如：这封邮件是垃圾邮件还是正常邮件？）
回归 (Regression)： 预测连续的值 （例如：预测明天的气温或房价）

(b) 无监督学习 (Unsupervised Learning)

这是一种没有老师的学习方式。训练数据是未标记的 (unlabeled)。系统的任务是自行探索数据，并发现其中隐藏的模式、结构或关系。

工作原理：

系统接收数据点，并被要求根据相似性对它们进行分组或构建结构。

常见任务：

聚类 (Clustering)： 将相似的项目归为一类。 （例如：市场营销公司利用此技术发现购买相似产品的客户群，从而进行精准投放。）

监督与无监督的类比：

监督学习： 你给孩子看 100 张猫和狗的照片，并告诉他们“这是猫，这是狗”。他们学会了对新图片进行分类。
无监督学习： 你给孩子 100 张混杂的图片，让他们把相似的物体分成两堆。他们不知道名字，但会根据共同特征找出类别（猫和狗）。

快速回顾：机器学习类别

监督学习： 使用已标记数据；找到从输入到已知输出的映射。
无监督学习： 使用未标记数据；发现隐藏的结构/模式（聚类）。

3. 高级 AI 与学习方法

在解决高度复杂的问题时——例如处理人类语音或自动驾驶——AI 依赖于强大的数学模型，这些模型主要受到人类大脑的启发。

人工神经网络 (Artificial Neural Networks, ANNs)

ANN 是受大脑生物神经网络结构启发的计算模型。它们是大多数现代机器学习和深度学习系统的基石。

结构：

ANN 由多层相互连接的处理单元组成，称为神经元 (neurons) 或节点。神经元之间的每个连接都有一个数值，称为权重 (weight)。这些权重就是网络通过训练不断调整并“学习”的内容。

输入层 (Input Layer)： 接收数据（例如：图像的像素值）。
隐藏层 (Hidden Layers)： 执行复杂的计算和特征提取。层数越多，网络越“深”。
输出层 (Output Layer)： 提供最终结果（例如：分类结果，如“汽车”或“卡车”）。

深度学习 (Deep Learning, DL)

深度学习其实就是机器学习的一种特定类型，它使用非常深的人工神经网络（即拥有许多隐藏层的网络）。

传统的机器学习可能只有一两层隐藏层；而深度学习可能有几十层。
这种深度使系统能够从原始数据中自动提取越来越复杂的特征。 （例如：在图像处理中，第一层可能检测边缘，下一层检测形状，最终层识别物体。）

为什么要使用深度学习？ 它在处理非结构化数据（图像、音频、文本）时表现出色，因为这些数据的特征很难手动定义。

强化学习 (Reinforcement Learning, RL)

强化学习是一种 AI 智能体通过在环境中采取行动并获得奖励 (rewards) 或惩罚 (penalties)（反馈）来学习决策的方法。

没有训练数据或导师；智能体完全通过试错 (trial and error) 来学习。
目标： 最大化长期的累积奖励。

类比： 教机器人走路。当它走对了，就得到奖励；当它摔倒了，就受到惩罚。最终它会摸索出最优的肌肉动作（动作）序列，以最大化奖励（保持站立）。

应用： 机器人技术、训练 AI 玩国际象棋或围棋等复杂游戏，以及优化工业流程。

快速回顾：高级学习

ANN： 以大脑为模型，在神经元之间使用加权连接（权重）。
深度学习： 使用拥有许多隐藏层的 ANN 来处理复杂任务。

4. 训练 AI：反向传播与回归

为了使人工神经网络有效学习，它需要一种机制，根据监督训练过程中犯下的错误来调整其权重。这种机制称为反向传播。

误差反向传播 (Back Propagation)

反向传播是训练 ANN 的主要算法。它的工作原理是计算输出层的误差，并将该误差向后传播到整个网络，以确定每个权重对错误的贡献程度。

分步过程（学习循环）：

前向传播 (Forward Pass)： 输入数据一层一层地通过网络，直到生成最终的输出预测。
误差计算 (Error Calculation)： 计算网络预测值与实际正确值（已知标签）之间的差异。这就是误差。
反向传播 (Backward Pass)： 误差从输出层向后传播（发送），经过隐藏层，回到输入层。

通过重复这个循环成千上万次，网络的权重会逐渐得到精炼，从而形成一个准确的模型。

记忆辅助： 反向传播是 AI 将错误“归咎”于特定权重的方式，这样它就知道如何修正它们。

机器学习中的回归方法

回归是监督学习中使用的一种基础统计方法。其主要目的是预测。

定义： 当 AI 需要预测一个连续值（范围内的数字，而非固定的类别）时，会使用回归方法。

示例：

分类： 预测类别：“这水果是苹果还是香蕉？”（离散输出）
回归： 预测数值：“这个苹果有多重？”或“明天的股票价格是多少？”（连续输出）

在机器学习背景下，回归方法建立自变量（输入）与因变量（我们想要预测的输出）之间的关系。

5. AI 的社会、经济与环境影响

人工智能是一种强大的工具，像任何技术一样，它具有深远的影响。

社会问题

偏差与公平性： AI 系统从数据中学习。如果训练数据包含人类偏差（例如历史上的种族或性别偏见），AI 将在决策中复制甚至放大这些偏差（例如贷款申请或招聘筛选）。
隐私： AI 训练依赖海量个人数据（大数据），引发了关于监控和滥用隐私信息的担忧。
虚假信息： AI 可以创建高度逼真的伪造内容（Deepfakes），威胁信任并导致虚假信息的传播。

经济问题

失业： AI 和自动化可以取代从事常规、重复或复杂分析工作的人类工人（例如工厂工人、某些行政岗位，甚至某些法律研究工作）。
创造新就业： 虽然一些工作消失了，但也创造了新的工作岗位，需要 AI 维护、伦理和数据科学方面的技能。
提高生产力： AI 处理海量数据集和复杂计算的速度远超人类，从而在金融、医疗、物流等行业带来显著的效率提升。

环境问题

能源消耗： 训练大型、复杂的深度学习模型（如大型语言模型）需要巨大的计算能力，导致极高的能源使用和巨大的碳足迹。
优化： 反过来，AI 也可用于优化能源电网、交通流量和制造流程，从而提高整体环境效率。 （例如：使用机器学习预测能源需求以减少浪费。）

作为一名计算专业人员： 考虑这些影响至关重要。像 BCS（英国计算机协会） 和 IEEE（电气电子工程师学会） 这样的伦理机构正在推广伦理准则，以确保 AI 的开发是负责任的。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。