歡迎來到聲音表示法!
你有沒有想過,電腦明明只能理解 0 和 1,究竟是如何播放出動人的交響樂或錄下你的聲音?這一章節將帶領你跨越自然界中連續的聲音世界,與數位數據中離散的二進位世界之間的鴻溝。
我們將學習如何擷取、儲存並精準重現聲波的基本流程與測量方法。別擔心概念聽起來很深奧;我們會一步步為你拆解!
1. 類比與數位聲音
在電腦處理聲音之前,我們必須先了解聲音在自然界的存在方式,以及電腦儲存它時兩者間的根本差異。
類比量 (Analogue Quantities)
我們在現實生活中聽到的聲音是一種類比量。
- 定義:類比數據是連續的。它在特定範圍內可以取任何值。
- 類比:想像一條平滑的斜坡。你可以在斜坡上站在無數個點。同樣地,真實的聲波在無限的時間週期內具有無限範圍的振幅(音量)。
- 例子:麥克風在處理前產生的電訊號。
數位量 (Digital Quantities)
電腦運作使用的是數位量。
- 定義:數位數據是離散的(分離的)。它只能取有限的一組特定數值,通常以二進位 (binary) 表示。
- 類比:想像一條樓梯。你一次只能站在某一個階梯上;你不能站在階梯之間。
- 目標:將平滑、連續的類比波轉換為一系列離散的數值測量結果,以便電腦儲存與處理。
2. 轉換過程:ADC 與 DAC
要讓聲音數據在現實世界與電腦之間轉換,我們依賴兩件關鍵硬件:類比數位轉換器 (ADC) 與數位類比轉換器 (DAC)。
類比數位轉換器 (ADC - Analogue to Digital Converter)
ADC 用於錄音(輸入)過程。它將連續的類比訊號轉換為二進位數據。
- 擷取 (Capture):接收類比聲波(例如來自麥克風)。
- 採樣 (Sampling):ADC 在固定的時間間隔下,測量聲波的振幅(高度)。
- 量化 (Quantisation):將每個測量到的振幅四捨五入(量化)至最接近的可用數位值,然後儲存為二進位數字。
- 輸出 (Output):一串二進位數字流(數位聲音數據)。
你知道嗎?當你在手機上記錄語音備忘錄時,ADC 每秒執行數百萬次採樣!
數位類比轉換器 (DAC - Digital to Analogue Converter)
DAC 用於播放(輸出)過程。它將數位的二進位數據轉換回電氣類比訊號。
- 輸入 (Input):DAC 從電腦記憶體接收二進位數字流。
- 轉換 (Conversion):將每個二進位數字翻譯回電氣振幅水平。
- 訊號重建 (Signal Reconstruction):這些水平值連接起來,形成階梯狀的類比訊號。
- 輸出 (Output):此電訊號被傳送到喇叭(或耳機),它們會平滑訊號並產生震動,從而發出可聽見的聲波。
ADC = Analogue to Digital(類比轉數位,錄音)
DAC = Digital to Analogue(數位轉類比,播放)
3. 數位表示參數
數位聲音檔案的品質與大小,完全取決於 ADC 過程中設定的兩個關鍵因素:採樣率 (Sampling Rate) 與 採樣解析度 (Sample Resolution)。
3.1 採樣解析度 (位元深度 - Bit Depth)
採樣解析度(或稱為位元深度)是用於表示單個採樣振幅(音量)的位元數。
- 對品質的影響:較高的解析度意味著有更多的振幅等級可選,使聲音能更真實地呈現原波形細微的音量變化。這減少了量化誤差(轉換過程中產生的四捨五入誤差)。
-
計算:如果我們使用 \(n\) 個位元作為解析度,我們可以表示 \(2^n\) 種不同的振幅值。
例子:8-bit 解析度提供 \(2^8 = 256\) 種振幅等級。16-bit 提供 \(2^{16} = 65,536\) 種等級(品質更好,用於 CD)。
類比:尺規
將解析度想像成尺上的刻度。以公分為單位的尺(低解析度)會迫使你進行大幅度的四捨五入;以毫米為單位的尺(高解析度)則能讓你進行精確得多的測量。
3.2 採樣率 (頻率 - Frequency)
採樣率(或採樣頻率)是每秒從類比波中採取的樣本數。通常以赫茲 (Hz) 為單位,1 Hz 表示每秒 1 個採樣。
- 定義:每秒採樣的速率。
- 單位:赫茲 (Hz) 或千赫茲 (kHz,每秒數千個採樣)。
- 對品質的影響:較高的採樣率能準確捕捉原始聲音中較高頻率(音高)的部分。如果採樣率太低,數位錄音將會遺失高頻細節。
- 例子:CD 品質使用 44,100 Hz (44.1 kHz) 的採樣率。
類比:相機
將採樣率想像成攝影機的幀率 (frame rate)。如果你每秒只拍幾張照片(低速率),快速的動作(高頻聲音)看起來會卡頓或模糊。如果你每秒拍很多張照片(高速率),動作就會平滑且準確。
4. 奈奎斯特定理 (Nyquist's Theorem)
那麼,我們到底需要多快的採樣速度才能準確捕捉聲音呢?這就是奈奎斯特定理所要回答的問題。
- 定理內容:為了準確表示類比訊號中的所有頻率,採樣率必須至少是訊號中最高頻率的兩倍。
-
公式:
最小採樣率 $\geq$ \(2 \times \text{最高頻率}\)
如果採樣率低於最高頻率的兩倍,系統可能會產生混疊 (aliasing) 現象,即重現後的聲音包含原始訊號中沒有的頻率,導致失真。
應用於人類聽覺
人類能聽到的最高頻率約為 20,000 Hz (20 kHz)。
因此,根據奈奎斯特定理:
最小採樣率 $\geq$ \(2 \times 20,000 \text{ Hz} = 40,000 \text{ Hz}\) (40 kHz)
這就是為什麼標準 CD 採樣率為 44.1 kHz 的原因——它舒適地超過了捕捉所有可聽聲音頻率的最低要求。
5. 計算聲音檔案大小
你必須具備計算聲音採樣所需總儲存空間的能力。請記住,聲音通常以立體聲 (stereo) 錄製(兩個聲道:左聲道與右聲道),但課程大綱主要側重於基於時間、速率與解析度的核心計算。
步驟計算
計算以位元 (bits) 為單位的檔案大小所需的公式為:
$$ \text{檔案大小 (bits)} = \text{採樣率 (Hz)} \times \text{解析度 (bits)} \times \text{時間 (秒數)} $$
若要將此大小轉換為位元組 (Bytes),你必須除以 8(因為 1 Byte = 8 bits)。
計算範例:
計算一個 10 秒的單聲道 (monaural) 音訊片段的儲存大小(單位為 Bytes),該片段以 40 kHz 採樣率和 16-bit 解析度錄製。
1. 如有必要,轉換單位:
速率 = 40 kHz = 40,000 Hz
解析度 = 16 bits
時間 = 10 秒
2. 計算位元大小:
$$ \text{bits} = 40,000 \times 16 \times 10 $$
$$ \text{bits} = 6,400,000 $$
3. 轉換為 Bytes:(除以 8)
$$ \text{Bytes} = 6,400,000 / 8 $$
$$ \text{Bytes} = 800,000 \text{ Bytes} $$
別忘了:如果音訊是立體聲(兩個聲道),你需要將最終大小乘以 2。務必仔細閱讀題目!
- 類比 (Analogue):連續的現實世界訊號。
- 數位 (Digital):離散、有限、電腦可讀的二進位數據。
- ADC:類比數位轉換器(用於錄音)。
- DAC:數位類比轉換器(用於播放)。
- 採樣率 (Hz):每秒測量振幅的頻率(影響捕捉到的頻率/音高)。
- 採樣解析度 (bits):每次測量所使用的位元數(影響精確度/音量細節)。
- 奈奎斯特定理 (Nyquist):採樣率必須至少是最高頻率的兩倍。