歡迎來到聲音表示法!

你有沒有想過,電腦明明只能理解 0 和 1,究竟是如何播放出動人的交響樂或錄下你的聲音?這一章節將帶領你跨越自然界中連續的聲音世界,與數位數據中離散的二進位世界之間的鴻溝。

我們將學習如何擷取、儲存並精準重現聲波的基本流程與測量方法。別擔心概念聽起來很深奧;我們會一步步為你拆解!

1. 類比與數位聲音

在電腦處理聲音之前,我們必須先了解聲音在自然界的存在方式,以及電腦儲存它時兩者間的根本差異。

類比量 (Analogue Quantities)

我們在現實生活中聽到的聲音是一種類比量

  • 定義:類比數據是連續的。它在特定範圍內可以取任何值。
  • 類比:想像一條平滑的斜坡。你可以在斜坡上站在無數個點。同樣地,真實的聲波在無限的時間週期內具有無限範圍的振幅(音量)。
  • 例子:麥克風在處理前產生的電訊號。

數位量 (Digital Quantities)

電腦運作使用的是數位量

  • 定義:數位數據是離散的(分離的)。它只能取有限的一組特定數值,通常以二進位 (binary) 表示。
  • 類比:想像一條樓梯。你一次只能站在某一個階梯上;你不能站在階梯之間。
  • 目標:將平滑、連續的類比波轉換為一系列離散的數值測量結果,以便電腦儲存與處理。

重點總結:真實聲音是類比的(無限/連續)。電腦需要數位數據(有限/離散)。

2. 轉換過程:ADC 與 DAC

要讓聲音數據在現實世界與電腦之間轉換,我們依賴兩件關鍵硬件:類比數位轉換器 (ADC) 與數位類比轉換器 (DAC)。

類比數位轉換器 (ADC - Analogue to Digital Converter)

ADC 用於錄音(輸入)過程。它將連續的類比訊號轉換為二進位數據。

  1. 擷取 (Capture):接收類比聲波(例如來自麥克風)。
  2. 採樣 (Sampling):ADC 在固定的時間間隔下,測量聲波的振幅(高度)。
  3. 量化 (Quantisation):將每個測量到的振幅四捨五入(量化)至最接近的可用數位值,然後儲存為二進位數字。
  4. 輸出 (Output):一串二進位數字流(數位聲音數據)。

你知道嗎?當你在手機上記錄語音備忘錄時,ADC 每秒執行數百萬次採樣!

數位類比轉換器 (DAC - Digital to Analogue Converter)

DAC 用於播放(輸出)過程。它將數位的二進位數據轉換回電氣類比訊號。

  1. 輸入 (Input):DAC 從電腦記憶體接收二進位數字流。
  2. 轉換 (Conversion):將每個二進位數字翻譯回電氣振幅水平。
  3. 訊號重建 (Signal Reconstruction):這些水平值連接起來,形成階梯狀的類比訊號。
  4. 輸出 (Output):此電訊號被傳送到喇叭(或耳機),它們會平滑訊號並產生震動,從而發出可聽見的聲波。

快速複習:
ADC = Analogue to Digital(類比轉數位,錄音)
DAC = Digital to Analogue(數位轉類比,播放)

3. 數位表示參數

數位聲音檔案的品質與大小,完全取決於 ADC 過程中設定的兩個關鍵因素:採樣率 (Sampling Rate)採樣解析度 (Sample Resolution)

3.1 採樣解析度 (位元深度 - Bit Depth)

採樣解析度(或稱為位元深度)是用於表示單個採樣振幅(音量)的位元數。

  • 對品質的影響:較高的解析度意味著有更多的振幅等級可選,使聲音能更真實地呈現原波形細微的音量變化。這減少了量化誤差(轉換過程中產生的四捨五入誤差)。
  • 計算:如果我們使用 \(n\) 個位元作為解析度,我們可以表示 \(2^n\) 種不同的振幅值。
    例子:8-bit 解析度提供 \(2^8 = 256\) 種振幅等級。16-bit 提供 \(2^{16} = 65,536\) 種等級(品質更好,用於 CD)。

類比:尺規
將解析度想像成尺上的刻度。以公分為單位的尺(低解析度)會迫使你進行大幅度的四捨五入;以毫米為單位的尺(高解析度)則能讓你進行精確得多的測量。

3.2 採樣率 (頻率 - Frequency)

採樣率(或採樣頻率)是每秒從類比波中採取的樣本數。通常以赫茲 (Hz) 為單位,1 Hz 表示每秒 1 個採樣。

  • 定義:每秒採樣的速率。
  • 單位:赫茲 (Hz) 或千赫茲 (kHz,每秒數千個採樣)。
  • 對品質的影響:較高的採樣率能準確捕捉原始聲音中較高頻率(音高)的部分。如果採樣率太低,數位錄音將會遺失高頻細節。
  • 例子:CD 品質使用 44,100 Hz (44.1 kHz) 的採樣率。

類比:相機
將採樣率想像成攝影機的幀率 (frame rate)。如果你每秒只拍幾張照片(低速率),快速的動作(高頻聲音)看起來會卡頓或模糊。如果你每秒拍很多張照片(高速率),動作就會平滑且準確。

4. 奈奎斯特定理 (Nyquist's Theorem)

那麼,我們到底需要多快的採樣速度才能準確捕捉聲音呢?這就是奈奎斯特定理所要回答的問題。

  • 定理內容:為了準確表示類比訊號中的所有頻率,採樣率必須至少是訊號中最高頻率的兩倍
  • 公式:
    最小採樣率 $\geq$ \(2 \times \text{最高頻率}\)

如果採樣率低於最高頻率的兩倍,系統可能會產生混疊 (aliasing) 現象,即重現後的聲音包含原始訊號中沒有的頻率,導致失真。

應用於人類聽覺

人類能聽到的最高頻率約為 20,000 Hz (20 kHz)。

因此,根據奈奎斯特定理:

最小採樣率 $\geq$ \(2 \times 20,000 \text{ Hz} = 40,000 \text{ Hz}\) (40 kHz)

這就是為什麼標準 CD 採樣率為 44.1 kHz 的原因——它舒適地超過了捕捉所有可聽聲音頻率的最低要求。

5. 計算聲音檔案大小

你必須具備計算聲音採樣所需總儲存空間的能力。請記住,聲音通常以立體聲 (stereo) 錄製(兩個聲道:左聲道與右聲道),但課程大綱主要側重於基於時間、速率與解析度的核心計算。

步驟計算

計算以位元 (bits) 為單位的檔案大小所需的公式為:
$$ \text{檔案大小 (bits)} = \text{採樣率 (Hz)} \times \text{解析度 (bits)} \times \text{時間 (秒數)} $$

若要將此大小轉換為位元組 (Bytes),你必須除以 8(因為 1 Byte = 8 bits)。

計算範例:
計算一個 10 秒的單聲道 (monaural) 音訊片段的儲存大小(單位為 Bytes),該片段以 40 kHz 採樣率和 16-bit 解析度錄製。

1. 如有必要,轉換單位:
速率 = 40 kHz = 40,000 Hz
解析度 = 16 bits
時間 = 10 秒

2. 計算位元大小:
$$ \text{bits} = 40,000 \times 16 \times 10 $$ $$ \text{bits} = 6,400,000 $$

3. 轉換為 Bytes:(除以 8)
$$ \text{Bytes} = 6,400,000 / 8 $$ $$ \text{Bytes} = 800,000 \text{ Bytes} $$

別忘了:如果音訊是立體聲(兩個聲道),你需要將最終大小乘以 2。務必仔細閱讀題目!


章節總結:需熟記的關鍵概念
  • 類比 (Analogue):連續的現實世界訊號。
  • 數位 (Digital):離散、有限、電腦可讀的二進位數據。
  • ADC:類比數位轉換器(用於錄音)。
  • DAC:數位類比轉換器(用於播放)。
  • 採樣率 (Hz):每秒測量振幅的頻率(影響捕捉到的頻率/音高)。
  • 採樣解析度 (bits):每次測量所使用的位元數(影響精確度/音量細節)。
  • 奈奎斯特定理 (Nyquist):採樣率必須至少是最高頻率的兩倍。