Representing sound

欢迎来到声音的表示（Representing Sound）！

你好，未来的计算机科学家们！我们正在深入探索数据表示（Data Representation）这一章节。你已经了解了计算机如何利用二进制存储文本和图像，但它们又是如何处理像声音这样无形且不断变化的内容呢？

在本章中，我们将学习把我们听到的声波（即模拟信号）转换为计算机能够理解和存储的数字信息（即由0和1组成的数字）的全过程。从流媒体音乐到视频通话，这是现代数字生活的基石！

1. 计算机如何“听到”声音：模拟 vs 数字

1.1 理解声波（模拟信号）

现实世界中的声音是模拟的（analog）。这意味着它是连续的，且时刻都在变化，就像平滑流动的波浪一样。

类比：想象一个调光开关。在“完全关闭”到“完全开启”之间，你可以将亮度设置在任何无限的数值上。
声波有两个我们关注的核心属性：振幅（Amplitude，即响度）和频率（Frequency，即音调）。
计算机无法直接处理这些连续的波，它们需要特定的、离散的数值。

1.2 实现声音数字化

为了在设备（如MP3播放器或硬盘）上存储声音，必须将连续的模拟波转换为一串数字——这个过程被称为数字化（digitisation）。

数字数据（Digital Data）：由离散（独立）数值表示的数据。
类比：想象一个普通的开关。它只有两种状态（0或1）。
数字化过程就是将平滑的声波转化为数以万计的微小数值快照。

快速复习：真实声音 = 模拟信号（连续的）；计算机声音 = 数字信号（离散的数字/二进制）。

2. 数字声音的核心：采样

将模拟波转化为数字信号的核心过程被称为采样（sampling）。这就像是在一段时间内不断地给声波拍下快照。

数字化过程的分步解析：

麦克风捕捉连续的模拟声波。
模数转换器（ADC）在固定的时间间隔内测量声波的振幅（响度）。这些测量值被称为采样点（samples）。
每个采样点被转换为二进制数（0和1）。
计算机将这些二进制数存储为数字音频文件。

2.1 采样率（采样频率）

采样率（Sample Rate）或采样频率是指计算机每秒钟对模拟波进行快照（采样）的次数。

测量单位：赫兹（Hz）或千赫兹（kHz）。1 kHz = 每秒1,000个采样点。
对质量的影响：
- 更高的采样率意味着每秒拍摄的快照更多，能更准确地捕捉波形，从而产生更高质量、更接近原始模拟信号的声音。
- 较低的采样率意味着快照较少，导致波形还原不够精确，音质下降，并可能产生“闷闷的”声音。
例子：标准CD音质的采样率为44,100 Hz（44.1 kHz）。这意味着每秒钟要进行44,100次采样！

记忆小贴士：想象观看动画电影。如果帧率（frame rate）（类似于采样率）太低，动作看起来就会不连贯；如果帧率高，动作就平滑且高质量。

3. 衡量精度：位深（分辨率）

如果说采样率决定了我们测量波形的频率，那么位深（Bit Depth）则决定了我们测量每个采样点振幅（音量/响度）时的精度。

3.1 理解位深

位深（Bit Depth）（也称采样分辨率）是用于存储每个采样点数值的比特（bit）数。

比特数决定了可以记录多少个不同的振幅级别。
可用级别的计算公式为 \(2^{\text{Bit Depth}}\)。
- 如果位深 = 8位，则有 \(2^8 = 256\) 种可能的振幅级别。
- 如果位深 = 16位，则有 \(2^{16} = 65,536\) 种可能的振幅级别。

3.2 对质量和文件大小的影响

更高的位深（例如16位或24位）意味着振幅的级别更多，可以更细腻、精确地还原微弱和强烈的声音（更好的动态范围），从而获得更高质量的音频。
较低的位深（例如8位）会导致振幅级别较少，声音还原度不够精确，并可能引入量化误差（quantisation error）（一种细微的舍入误差），听起来像是失真或噪音。
关键点：更高的位深意味着每个采样点占用更多的比特，这会增加整体的文件大小。

核心结论：采样率和位深都直接影响数字音频文件的质量和文件大小。

4. 计算音频文件大小

计算存储数字音频片段所需的文件大小是一项非常重要的技能。这能帮助我们理解在选择质量设置时所涉及的权衡。

文件大小计算公式（单位为bit）：

\(\text{文件大小} = \text{采样率 (Hz)} \times \text{位深 (bits)} \times \text{时长 (秒)} \times \text{声道数}\)

请记住：

单声道（Mono）使用1个声道。
立体声（Stereo）使用2个声道（左扬声器一个，右扬声器一个）。

4.1 分步计算指南

让我们计算一个10秒、44,100 Hz采样率、16位分辨率的立体声音频片段的大小。

第一步：将各变量相乘，得到以 BITS 为单位的大小。

\(\text{文件大小 (bits)} = 44,100 \times 16 \times 10 \times 2\)
\(\text{文件大小 (bits)} = 14,112,000 \text{ bits}\)

第二步：将结果从 BITS 转换为 BYTES。

因为 8 bits = 1 byte，所以我们将结果除以 8。

\(\text{文件大小 (bytes)} = 14,112,000 / 8\)
\(\text{文件大小 (bytes)} = 1,764,000 \text{ bytes}\)

第三步：如果需要，将结果转换为更直观的单位（KB 或 MB）。

（请记住：1 KB = 1024 Bytes, 1 MB = 1024 KB）
\(\text{文件大小 (MB)} = 1,764,000 / 1024 / 1024 \approx 1.68 \text{ MB}\)

避开常见错误！

学生们经常忘记包含声道数（立体声为2），或者忘记最后一步从bits到bytes的转换（除以8）。请确保将这些步骤纳入你的解题流程！

公式快速复习：
大小 = 采样率 × 位深 × 时间 × 声道数
（记住最后要除以8以得到字节数！）

5. 质量与大小的权衡

在数据表示中，我们几乎总是需要在数据质量和存储所需的文件大小之间做出选择，这就是质量/大小权衡（quality/size trade-off）。

对于音频文件：

5.1 提高质量会增加大小

更高的采样率：我们每秒拍摄更多的快照。快照越多 = 需要存储的数据越多，因此文件变大。
更高的位深：我们为每个快照使用更多的比特。每个快照占用的比特越多 = 数据量越大，因此文件变大。

5.2 减小大小会降低质量

如果你想要更小的文件（例如为了更快的流媒体播放或电子邮件发送）：
- 你必须降低采样率（精确度降低）。
- 你必须降低位深（精度/动态范围降低）。

你知道吗？这就是为什么音乐流媒体服务通常有“高品质”或“标准品质”选项的原因。高品质设置使用更高的采样率和位深，会消耗更多的流量！

快速复习与总结

你已经成功掌握了现实世界中平滑的声波是如何被捕获并作为数字二进制数据存储的！

模拟（Analog）：连续的、现实世界的声波。
数字（Digital）：计算机使用的离散二进制数字。
采样（Sampling）：以固定间隔测量波形振幅的过程。
采样率（Sample Rate）：测量频率（影响保真度/质量）。
位深（Bit Depth/Resolution）：测量的精度（影响动态范围/质量）。
权衡（Trade-Off）：更高的采样率或位深意味着更好的质量，但会导致文件体积显著增加。

干得漂亮！理解这些概念不仅对考试至关重要，更有助于你理解所有你喜爱的音乐和媒体背后的技术！

* thinka提供的内容由AI生成，可能并非总是准确或最新。请将其用作辅助资源，并与官方材料进行核实。