人工智能系统的创建 (第 3.16 节)

未来的计算机科学家们,大家好!本章将带你深入探索计算机科学中最令人兴奋、发展最迅速的领域之一:人工智能 (AI)。我们将一起探讨如何教计算机思考、学习并解决问题,重点关注其底层技术(如神经网络),以及人工智能带来的巨大益处与严峻风险。
别担心概念听起来过于抽象——我们会将这些复杂的思想拆解成简单易懂的内容。让我们一起着手构建“数字大脑”吧!


3.16.1 人工智能的应用与特征

人工智能不仅仅是指机器人接管世界(目前还不是!)。它指的是构建能够执行传统上需要人类智慧才能完成的任务的系统。

什么系统可以被称为“人工智能”?

目前尚无单一的共识定义,但通常情况下,如果一个系统能解决复杂问题,并且通过以下方式之一得出解决方案,它就被认为是人工智能:

  • 使用与人类相似的方法(例如,通过观察模式)。
  • 实现的解决方案至少等同于人类能达到的水平。

你知道吗? 从历史上看,计算机系统无法通过简单的分步算法解决这类问题,这就是人工智能得以发展的初衷——为了处理需要更复杂、“智能化”方法的任务。

弱人工智能 (Narrow AI) 与通用人工智能 (General AI)

目前,我们每天使用的 AI 系统都是弱人工智能 (Narrow AI) 的范例。

  • 弱人工智能: 指能出色完成某一项特定任务的系统(例如:下棋、图像识别、产品推荐)。它们无法处理其领域之外的任务。
  • 通用智能系统: 这是目前的研究领域。这类系统具备像人类一样的智慧,能够跨越多种任务领域,也就是我们在科幻小说中常见的形态。目前的人工智能并非通用智能。
人工智能的常见应用领域

如今,人工智能已广泛应用于多个领域:

  • 生成式 AI (Generative AI): 能创造新内容的 AI(例如:撰写文章、生成图像、创作音乐)。例子:ChatGPT 或 Midjourney。
  • 搜索与推荐系统: 预测你下一步想看什么或买什么的算法。例子:Netflix 推荐电影,或亚马逊推荐商品。
  • 战略游戏: AI 可以精通国际象棋或围棋等游戏,通常能击败世界上顶尖的人类选手。
  • 医疗诊断: 通过分析扫描结果(如 X 光或核磁共振成像)来识别疾病或模式,其准确性和速度往往超过人类。
快速复习:特征
AI 用于处理复杂问题,目前的 AI 属于弱人工智能。其主要应用包括创造新事物(生成式 AI)和进行预测(推荐/诊断)。

3.16.2 创建智能系统:神经网络与训练

神经网络的概念

神经网络 (Neural Network) 是现代人工智能系统中使用的基本结构。

  • 它是一个由相互连接的节点(有时称为“神经元”)组成的网络,旨在模拟人类大脑的处理方式。

类比: 把神经网络想象成一个数字大脑。它接收信息,经过多个步骤处理,最后输出一个答案。

简单神经网络的结构

一个简单的神经网络由多个层 (Layers) 构成:

  1. 输入层 (Input Layer): 接收原始数据(问题的基础特征)。例子:在图像识别中,输入可能是图像的像素值。
  2. 隐藏处理层 (Hidden Processing Layer): “思考”的过程在这里发生。一层中的节点处理输入数据,并将输出传递给下一层的节点。
  3. 输出层 (Output Layer): 产生最终结果或预测。例子:输出结果可能是“猫”或“狗”。

节点之间的连接是有权重的:上一层节点的输出通过加权,形成下一层节点的输入。这些权重决定了一个节点对下一个节点的影响程度。调整这些权重,正是网络“学习”的方式!

机器学习与训练

机器学习 (Machine Learning) 是一种人工智能类型,系统的性能会根据经验(即输入大量数据)得到提升

通过反向传播 (Backpropagation) 进行训练

网络如何调整这些权重来变得更准确?通常使用一种称为反向传播的算法。

  1. 前向传播 (Forward Pass): 网络接收训练数据并做出预测(例如:看到一张猫的图片却猜成了“狗”)。
  2. 计算误差: 网络将输出与正确答案(“基准真值”)进行比较,并计算出误差。
  3. 反向传播 (Backward Pass): 误差从后向前逐层传递回网络。
  4. 调整权重: 根据每个连接对误差的贡献程度,算法会调整权重,使得网络下一次给出正确答案的可能性稍微增大。

这个过程会重复数百万次,直到网络的性能达到最优。

深度学习 (Deep Learning)

当你听到深度学习这个词时,它指的是使用了多个隐藏节点层(通常是几十层甚至几百层)的神经网络系统。增加层数使系统能够处理极其复杂的问题,并识别非常微妙的模式,例如理解人类语言或复杂的视觉场景。

训练数据中的偏差问题

人工智能系统的水平取决于其训练数据的质量。

  • 关键点: 在选择训练数据时必须非常谨慎,以确保系统不会产生偏差 (Bias)
  • 例子: 如果一个医疗 AI 只接受过浅肤色人群的皮肤癌图像训练,那么在诊断深肤色患者时,它可能会出现严重的失误(表现出偏差),因为它缺乏识别这类病例模式的经验(数据)。
关键要点:神经网络
神经网络使用带有加权连接的层(输入层、隐藏层、输出层)。它们通过机器学习进行学习,通常利用反向传播根据误差调整权重。深度学习意味着拥有多个隐藏层。

3.16.3 人工智能的益处与风险

人工智能力量强大,正如任何强大的技术一样,它既带来了巨大的机遇,也带来了显著的挑战。

使用人工智能的益处

与人类或传统计算方法相比,人工智能系统具有以下几个核心优势:

  • 改进且更一致的决策: AI 排除了人类情绪和疲劳的影响,从而实现客观且稳定的分析(例如:更准确地分析医疗数据)。
  • 快速分析海量数据的能力: AI 可以处理人类团队无法处理的“大数据”。
  • 全天候可用性: AI 系统不需要休息或睡眠,可以 24/7 不间断运行。
  • 运营成本更低: 虽然初始设置成本高,但从长远来看,运行 AI 系统比聘请人类专家更经济。
  • 偏远地区的可获得性: AI 专业知识可以传递到任何地方,为缺乏人类专家支持的地区提供服务。
与人工智能相关的风险

同学们必须考虑以下伦理和社会风险:

  • 职位减少与社会影响: 由 AI 驱动的自动化可能导致特定行业的大规模失业。
  • 决策中的偏差: 如果训练数据本身存在缺陷(例如:反映了历史上的性别或种族偏见),AI 将会在决策中延续并放大这种偏差(例如:贷款审批、招聘)。
  • 虚假信息(错误的训练数据): 如果系统在错误的数据上进行训练,它就会产生错误甚至是有害的输出。
  • 抄袭: 生成式 AI 在基于现有作品创作内容时,引发了版权和知识产权方面的担忧。
  • 监控系统的使用: AI 驱动的面部识别和追踪系统对个人隐私和公民权利构成了严重威胁。
  • 超级智能系统对人类生存的风险: 理论上,如果一个 AI 超越了人类的认知能力(假设的通用人工智能),它可能会以损害人类利益的方式行事。
常见误区:
讨论偏差时,请记住它通常源于训练数据,而非恶意的编程。数据反映了现实世界中的不公平,而 AI 只是学习了这些不公平的规则。

最终总结:人工智能

人工智能是计算机科学的一个分支,它通过神经网络等结构,构建能够从数据中学习的系统(机器学习)。尽管这些系统在效率和分析方面带来了巨大效益,但我们必须积极减轻与偏差、失业以及先进系统长期安全性相关的风险。