Creating artificially intelligent systems

人工智能系统的创建 (第 3.16 节)

未来的计算机科学家们，大家好！本章将带你深入探索计算机科学中最令人兴奋、发展最迅速的领域之一：人工智能 (AI)。我们将一起探讨如何教计算机思考、学习并解决问题，重点关注其底层技术（如神经网络），以及人工智能带来的巨大益处与严峻风险。
别担心概念听起来过于抽象——我们会将这些复杂的思想拆解成简单易懂的内容。让我们一起着手构建“数字大脑”吧！

3.16.1 人工智能的应用与特征

人工智能不仅仅是指机器人接管世界（目前还不是！）。它指的是构建能够执行传统上需要人类智慧才能完成的任务的系统。

什么系统可以被称为“人工智能”？

目前尚无单一的共识定义，但通常情况下，如果一个系统能解决复杂问题，并且通过以下方式之一得出解决方案，它就被认为是人工智能：

使用与人类相似的方法（例如，通过观察模式）。
实现的解决方案至少等同于人类能达到的水平。

你知道吗？ 从历史上看，计算机系统无法通过简单的分步算法解决这类问题，这就是人工智能得以发展的初衷——为了处理需要更复杂、“智能化”方法的任务。

弱人工智能 (Narrow AI) 与通用人工智能 (General AI)

目前，我们每天使用的 AI 系统都是弱人工智能 (Narrow AI) 的范例。

弱人工智能： 指能出色完成某一项特定任务的系统（例如：下棋、图像识别、产品推荐）。它们无法处理其领域之外的任务。
通用智能系统： 这是目前的研究领域。这类系统具备像人类一样的智慧，能够跨越多种任务领域，也就是我们在科幻小说中常见的形态。目前的人工智能并非通用智能。

人工智能的常见应用领域

如今，人工智能已广泛应用于多个领域：

生成式 AI (Generative AI)： 能创造新内容的 AI（例如：撰写文章、生成图像、创作音乐）。例子：ChatGPT 或 Midjourney。
搜索与推荐系统： 预测你下一步想看什么或买什么的算法。例子：Netflix 推荐电影，或亚马逊推荐商品。
战略游戏： AI 可以精通国际象棋或围棋等游戏，通常能击败世界上顶尖的人类选手。
医疗诊断： 通过分析扫描结果（如 X 光或核磁共振成像）来识别疾病或模式，其准确性和速度往往超过人类。

快速复习：特征
AI 用于处理复杂问题，目前的 AI 属于弱人工智能。其主要应用包括创造新事物（生成式 AI）和进行预测（推荐/诊断）。

3.16.2 创建智能系统：神经网络与训练

神经网络的概念

神经网络 (Neural Network) 是现代人工智能系统中使用的基本结构。

它是一个由相互连接的节点（有时称为“神经元”）组成的网络，旨在模拟人类大脑的处理方式。

类比： 把神经网络想象成一个数字大脑。它接收信息，经过多个步骤处理，最后输出一个答案。

简单神经网络的结构

一个简单的神经网络由多个层 (Layers) 构成：

输入层 (Input Layer)： 接收原始数据（问题的基础特征）。例子：在图像识别中，输入可能是图像的像素值。
隐藏处理层 (Hidden Processing Layer)： “思考”的过程在这里发生。一层中的节点处理输入数据，并将输出传递给下一层的节点。
输出层 (Output Layer)： 产生最终结果或预测。例子：输出结果可能是“猫”或“狗”。

节点之间的连接是有权重的：上一层节点的输出通过加权，形成下一层节点的输入。这些权重决定了一个节点对下一个节点的影响程度。调整这些权重，正是网络“学习”的方式！

机器学习与训练

机器学习 (Machine Learning) 是一种人工智能类型，系统的性能会根据经验（即输入大量数据）得到提升。

通过反向传播 (Backpropagation) 进行训练

网络如何调整这些权重来变得更准确？通常使用一种称为反向传播的算法。

前向传播 (Forward Pass)： 网络接收训练数据并做出预测（例如：看到一张猫的图片却猜成了“狗”）。
计算误差： 网络将输出与正确答案（“基准真值”）进行比较，并计算出误差。
反向传播 (Backward Pass)： 误差从后向前逐层传递回网络。
调整权重： 根据每个连接对误差的贡献程度，算法会调整权重，使得网络下一次给出正确答案的可能性稍微增大。

这个过程会重复数百万次，直到网络的性能达到最优。

深度学习 (Deep Learning)

当你听到深度学习这个词时，它指的是使用了多个隐藏节点层（通常是几十层甚至几百层）的神经网络系统。增加层数使系统能够处理极其复杂的问题，并识别非常微妙的模式，例如理解人类语言或复杂的视觉场景。

训练数据中的偏差问题

人工智能系统的水平取决于其训练数据的质量。

关键点： 在选择训练数据时必须非常谨慎，以确保系统不会产生偏差 (Bias)。
例子： 如果一个医疗 AI 只接受过浅肤色人群的皮肤癌图像训练，那么在诊断深肤色患者时，它可能会出现严重的失误（表现出偏差），因为它缺乏识别这类病例模式的经验（数据）。

关键要点：神经网络
神经网络使用带有加权连接的层（输入层、隐藏层、输出层）。它们通过机器学习进行学习，通常利用反向传播根据误差调整权重。深度学习意味着拥有多个隐藏层。

3.16.3 人工智能的益处与风险

人工智能力量强大，正如任何强大的技术一样，它既带来了巨大的机遇，也带来了显著的挑战。

使用人工智能的益处

与人类或传统计算方法相比，人工智能系统具有以下几个核心优势：

改进且更一致的决策： AI 排除了人类情绪和疲劳的影响，从而实现客观且稳定的分析（例如：更准确地分析医疗数据）。
快速分析海量数据的能力： AI 可以处理人类团队无法处理的“大数据”。
全天候可用性： AI 系统不需要休息或睡眠，可以 24/7 不间断运行。
运营成本更低： 虽然初始设置成本高，但从长远来看，运行 AI 系统比聘请人类专家更经济。
偏远地区的可获得性： AI 专业知识可以传递到任何地方，为缺乏人类专家支持的地区提供服务。

与人工智能相关的风险

同学们必须考虑以下伦理和社会风险：

职位减少与社会影响： 由 AI 驱动的自动化可能导致特定行业的大规模失业。
决策中的偏差： 如果训练数据本身存在缺陷（例如：反映了历史上的性别或种族偏见），AI 将会在决策中延续并放大这种偏差（例如：贷款审批、招聘）。
虚假信息（错误的训练数据）： 如果系统在错误的数据上进行训练，它就会产生错误甚至是有害的输出。
抄袭： 生成式 AI 在基于现有作品创作内容时，引发了版权和知识产权方面的担忧。
监控系统的使用： AI 驱动的面部识别和追踪系统对个人隐私和公民权利构成了严重威胁。
超级智能系统对人类生存的风险： 理论上，如果一个 AI 超越了人类的认知能力（假设的通用人工智能），它可能会以损害人类利益的方式行事。

常见误区：
讨论偏差时，请记住它通常源于训练数据，而非恶意的编程。数据反映了现实世界中的不公平，而 AI 只是学习了这些不公平的规则。

最终总结：人工智能

人工智能是计算机科学的一个分支，它通过神经网络等结构，构建能够从数据中学习的系统（机器学习）。尽管这些系统在效率和分析方面带来了巨大效益，但我们必须积极减轻与偏差、失业以及先进系统长期安全性相关的风险。

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。