📊 第 10 章:統計學(延伸內容)
累積頻數圖 (Cumulative Frequency Diagrams)
各位數學愛好者,大家好!這一章將帶領大家把數據視覺化的理解提升到另一個層次。我們之前已經學過頻數表和條形圖,但有時我們需要了解數據是如何隨時間或數值不斷累積的。這就是累積頻數圖 (Cumulative Frequency Diagrams) 大派用場的時候了!
別擔心,聽起來雖然複雜,但它其實只是將「累計總數」畫在圖表上一種特殊方式。掌握這個課題對於處理大型分組數據時,快速且精確地計算離差和平均值(例如中位數)是非常必要的。
1. 理解累積頻數 (Cumulative Frequency, CF)
1.1 什麼是累積頻數?
頻數 (Frequency) 代表某個數值或數值組出現的次數。
累積頻數 (Cumulative Frequency, CF) 是這些頻數的累計總數。它告訴你截至某個數值為止,數據點的總數是多少。
類比:想像你在記錄每天騎腳踏車的公里數。頻數是每天的距離;而累積頻數則是從開始那天起累計騎行的總距離。
1.2 建立累積頻數表
累積頻數幾乎總是與分組連續數據 (Grouped Continuous Data) 一起使用。
要建立這張表,你需要兩欄:組別 (class intervals) 和頻數 (frequencies)。然後,你就可以計算 CF 了。
步驟指南:計算 CF
- 從第一組的頻數開始,這就是你的第一個累積頻數。
- 對於第二組,將其頻數加上前一個累積頻數。
- 重複這個過程,直到最後一組為止。
快速檢查: 累積頻數欄位中的最後一個數值必須等於整個數據集的總頻數 (\(N\))。
🔑 核心概念:繪製點
在繪製累積頻數圖時,你需要將 CF 數值對應到該組的組上界 (Upper Class Boundary)。
為什麼?因為累積頻數值告訴你的是「小於或等於」該組上限的數據點有多少個。
例子:如果組別是 \(10 < t \leq 20\),而 CF 為 15,這意味著有 15 個數據點小於 20。因此,我們繪製 \((20, 15)\)。
2. 繪製累積頻數圖 (Ogive)
這種圖表通常被稱為 Ogive(累積頻數曲線)。正確繪製它是一項重要的考試技能。
2.1 設置與坐標軸
- X 軸(橫軸): 代表數據本身(例如身高、時間、分數)。請務必清晰標註此軸。
- Y 軸(縱軸): 代表累積頻數 (CF)。其範圍必須從 0 到總頻數 (\(N\))。
2.2 繪圖過程
- 起點: 曲線必須從最低可能值開始,此時 CF 為 0。如果你的第一個組別是 \(10 < x \leq 20\),你必須繪製 \((10, 0)\)。這樣可以確保圖表從一開始就涵蓋所有數據。
- 繪製點: 將計算出的累積頻數值對應到組上界,用整潔的小十字 \((x)\) 標記。
- 曲線: 用平滑曲線將點連接起來(是一條流暢的線,而不是直線段)。這一點至關重要,因為我們處理的是連續數據,意味著數值是平滑變化的。
⚠️ 常見錯誤警示!
切勿用尺將點連接起來(即不要畫成折線)。累積頻數代表的是一個平滑增加的分佈。使用尺會導致你失去繪製平滑曲線的分數!
此外,記得一定要對應組上界繪圖,而不是組中點或組下界(除了起點 \((0, 0)\) 或第一個組下界之外)。
3. 解讀圖表:尋找平均值與離差
當平滑的累積頻數曲線畫好後,我們就可以用它來估計關鍵的位置指標和離差指標。這些估計值通常都是直接從圖中讀取的。
3.1 中位數 (Median, \(Q_2\))
中位數是將所有數據按順序排列後的中間值。
尋找中位數的方法:
- 計算位置:中位數位置 = \(\frac{N}{2}\),其中 \(N\) 是總頻數。
- 在 CF (縱軸) 上找到這個位置。
- 畫一條水平線到曲線處。
- 從曲線處畫一條垂直線到數據 (橫軸)。
- 讀取數據軸上的數值,這就是估計出的中位數。
3.2 四分位數 (Quartiles, \(Q_1\) 和 \(Q_3\))
四分位數將數據分為四個相等的部分。
- 下四分位數 (\(Q_1\)): 位於 25% 位置的數值。
位置:\(\frac{1}{4} \times N\) 或 \(0.25 \times N\)。 - 上四分位數 (\(Q_3\)): 位於 75% 位置的數值。
位置:\(\frac{3}{4} \times N\) 或 \(0.75 \times N\)。
記憶口訣:\(Q_1, Q_2\)(中位數), \(Q_3\) 對應四分之一:分別是數據的 25%, 50%, 75%。
3.3 四分位距 (Interquartile Range, IQR)
IQR 是一種衡量離差 (spread) 的指標,它衡量了中間 50% 數據的分佈範圍。
公式:
$$IQR = Q_3 - Q_1$$
IQR 較小意味著中間 50% 的數據分佈非常集中;IQR 較大則意味著中間 50% 的數據分佈非常分散。
3.4 百分位數 (Percentiles)
百分位數將數據分為 100 個相等的部分。如果你想找出特定的基準(例如前 10% 的分數),這非常有用。
尋找 \(P^{\text{th}}\) 百分位數 的方法:
- 計算位置:\(\frac{P}{100} \times N\)。
- 從數據軸讀取對應的數值。
例子:要找到第 80 百分位數,請在 CF 軸上找到 \(0.80 \times N\) 的位置。
✅ 快速複習:解讀圖表
- CF 圖有什麼用途? 用於估計分組連續數據的中位數、四分位數和百分位數。
- 如何找出數據值? 從 CF 軸出發,向右找到曲線,再向下讀取數據軸。
- 如果題目問:「有多少學生的分數低於 70 分?」 在數據軸 (x) 上找到 70,向上找到曲線,再向左讀取 CF 軸 (y) 的數值。
- 精確度: 務必根據 x 軸提供的刻度讀取最終答案,通常取適當的精確度(除非另有說明,一般為 3 位有效數字)。
你知道嗎?
雖然 CF 圖非常適合用來尋找中位數和四分位數,但它不能用來尋找眾數 (mode)。若要尋找眾數,通常需要頻數多邊形或直方圖。
繼續練習你的繪圖和讀圖技巧吧——你一定做得到的!