📊 第 10 章:統計學(延伸內容)
累積頻數圖 (Cumulative Frequency Diagrams)

各位數學愛好者,大家好!這一章將帶領大家把數據視覺化的理解提升到另一個層次。我們之前已經學過頻數表和條形圖,但有時我們需要了解數據是如何隨時間或數值不斷累積的。這就是累積頻數圖 (Cumulative Frequency Diagrams) 大派用場的時候了!

別擔心,聽起來雖然複雜,但它其實只是將「累計總數」畫在圖表上一種特殊方式。掌握這個課題對於處理大型分組數據時,快速且精確地計算離差和平均值(例如中位數)是非常必要的。


1. 理解累積頻數 (Cumulative Frequency, CF)

1.1 什麼是累積頻數?

頻數 (Frequency) 代表某個數值或數值組出現的次數。
累積頻數 (Cumulative Frequency, CF) 是這些頻數的累計總數。它告訴你截至某個數值為止,數據點的總數是多少。

類比:想像你在記錄每天騎腳踏車的公里數。頻數是每天的距離;而累積頻數則是從開始那天起累計騎行的總距離。

1.2 建立累積頻數表

累積頻數幾乎總是與分組連續數據 (Grouped Continuous Data) 一起使用。

要建立這張表,你需要兩欄:組別 (class intervals) 和頻數 (frequencies)。然後,你就可以計算 CF 了。

步驟指南:計算 CF
  1. 從第一組的頻數開始,這就是你的第一個累積頻數。
  2. 對於第二組,將其頻數加上前一個累積頻數。
  3. 重複這個過程,直到最後一組為止。

快速檢查: 累積頻數欄位中的最後一個數值必須等於整個數據集的總頻數 (\(N\))


🔑 核心概念:繪製點

在繪製累積頻數圖時,你需要將 CF 數值對應到該組的組上界 (Upper Class Boundary)

為什麼?因為累積頻數值告訴你的是「小於或等於」該組上限的數據點有多少個。

例子:如果組別是 \(10 < t \leq 20\),而 CF 為 15,這意味著有 15 個數據點小於 20。因此,我們繪製 \((20, 15)\)。


2. 繪製累積頻數圖 (Ogive)

這種圖表通常被稱為 Ogive(累積頻數曲線)。正確繪製它是一項重要的考試技能。

2.1 設置與坐標軸

  • X 軸(橫軸): 代表數據本身(例如身高、時間、分數)。請務必清晰標註此軸。
  • Y 軸(縱軸): 代表累積頻數 (CF)。其範圍必須從 0 到總頻數 (\(N\))。

2.2 繪圖過程

  1. 起點: 曲線必須從最低可能值開始,此時 CF 為 0。如果你的第一個組別是 \(10 < x \leq 20\),你必須繪製 \((10, 0)\)。這樣可以確保圖表從一開始就涵蓋所有數據。
  2. 繪製點: 將計算出的累積頻數值對應到組上界,用整潔的小十字 \((x)\) 標記。
  3. 曲線:平滑曲線將點連接起來(是一條流暢的線,而不是直線段)。這一點至關重要,因為我們處理的是連續數據,意味著數值是平滑變化的。
⚠️ 常見錯誤警示!

切勿用尺將點連接起來(即不要畫成折線)。累積頻數代表的是一個平滑增加的分佈。使用尺會導致你失去繪製平滑曲線的分數!

此外,記得一定要對應組上界繪圖,而不是組中點或組下界(除了起點 \((0, 0)\) 或第一個組下界之外)。


3. 解讀圖表:尋找平均值與離差

當平滑的累積頻數曲線畫好後,我們就可以用它來估計關鍵的位置指標和離差指標。這些估計值通常都是直接從圖中讀取的。

3.1 中位數 (Median, \(Q_2\))

中位數是將所有數據按順序排列後的中間值

尋找中位數的方法:

  1. 計算位置:中位數位置 = \(\frac{N}{2}\),其中 \(N\) 是總頻數。
  2. CF (縱軸) 上找到這個位置。
  3. 畫一條水平線到曲線處。
  4. 從曲線處畫一條垂直線到數據 (橫軸)
  5. 讀取數據軸上的數值,這就是估計出的中位數。

3.2 四分位數 (Quartiles, \(Q_1\) 和 \(Q_3\))

四分位數將數據分為四個相等的部分。

  • 下四分位數 (\(Q_1\)): 位於 25% 位置的數值。
    位置:\(\frac{1}{4} \times N\) 或 \(0.25 \times N\)。
  • 上四分位數 (\(Q_3\)): 位於 75% 位置的數值。
    位置:\(\frac{3}{4} \times N\) 或 \(0.75 \times N\)。

記憶口訣:\(Q_1, Q_2\)(中位數), \(Q_3\) 對應四分之一:分別是數據的 25%, 50%, 75%。

3.3 四分位距 (Interquartile Range, IQR)

IQR 是一種衡量離差 (spread) 的指標,它衡量了中間 50% 數據的分佈範圍。

公式:
$$IQR = Q_3 - Q_1$$

IQR 較小意味著中間 50% 的數據分佈非常集中;IQR 較大則意味著中間 50% 的數據分佈非常分散。

3.4 百分位數 (Percentiles)

百分位數將數據分為 100 個相等的部分。如果你想找出特定的基準(例如前 10% 的分數),這非常有用。

尋找 \(P^{\text{th}}\) 百分位數 的方法:

  1. 計算位置:\(\frac{P}{100} \times N\)。
  2. 從數據軸讀取對應的數值。

例子:要找到第 80 百分位數,請在 CF 軸上找到 \(0.80 \times N\) 的位置。


✅ 快速複習:解讀圖表

  • CF 圖有什麼用途? 用於估計分組連續數據的中位數、四分位數和百分位數。
  • 如何找出數據值? 從 CF 軸出發,向右找到曲線,再向下讀取數據軸。
  • 如果題目問:「有多少學生的分數低於 70 分?」數據軸 (x) 上找到 70,向上找到曲線,再向左讀取 CF 軸 (y) 的數值。
  • 精確度: 務必根據 x 軸提供的刻度讀取最終答案,通常取適當的精確度(除非另有說明,一般為 3 位有效數字)。

你知道嗎?

雖然 CF 圖非常適合用來尋找中位數和四分位數,但它不能用來尋找眾數 (mode)。若要尋找眾數,通常需要頻數多邊形或直方圖。

繼續練習你的繪圖和讀圖技巧吧——你一定做得到的!