🌟 全面學習筆記:累積頻數圖 (Ogive) 🌟
歡迎來到累積頻數圖 (Cumulative Frequency Diagrams) 的世界!別被這複雜的名字嚇到了——這些圖表其實是一種非常棒的方法,能幫你視覺化數據是如何在數值範圍內逐步累加的。當處理分組數據時,它們是找出關鍵平均值和分佈情況的必備工具。
在本章中,我們將學習如何繪製這些特殊的圖表(通常稱為 Ogive,即累積頻數多邊形),最重要的是,學習如何從中提取強大的統計資訊,例如中位數和四分位數。
1. 理解累積頻數 (Cumulative Frequency, CF)
什麼是累積頻數?
當你擁有一組分組數據(例如按組別整理的身高或考試分數)時,「頻數」告訴你該特定組別中有多少人。累積頻數 (Cumulative Frequency, CF) 則是頻數的累加總計。
想像一下往桶子裡倒水。頻數是你一次倒進去的水量,而累積頻數則是桶子裡當前總共的水量。
關鍵概念:製作 CF 表格
計算 CF 非常簡單,只需將當前組別的頻數加上之前所有組別的 CF 總和即可。
示例情境:數學考試分數(共 50 名學生)。
| 組距 (分數, $x$) | 頻數 ($f$) | 累積頻數 (CF) |
|---|---|---|
| $0 < x \le 20$ | 5 | 5 (第一個頻數即為 CF) |
| $20 < x \le 40$ | 12 | $5 + 12 = 17$ |
| $40 < x \le 60$ | 20 | $17 + 20 = 37$ |
| $60 < x \le 80$ | 10 | $37 + 10 = 47$ |
| $80 < x \le 100$ | 3 | $47 + 3 = 50$ (學生總數, $N$) |
快速檢查:最終的累積頻數必須等於數據點的總數 (\(N\))。如果兩者不匹配,說明你計算出錯了!
2. 繪製累積頻數圖 (Ogive)
累積頻數圖是一個將數據值對應到累積頻數的圖表。這種圖表通常被稱為 Ogive(讀音類似 O-jive)。
關鍵步驟:使用組界上限 (Upper Class Boundaries, UCB)
繪製點時,你必須使用每個組距的組界上限 (UCB),因為累積頻數告訴你的是達到並包含該邊界值為止的學生總數。
類比:如果有 17 名學生得分在 40 分或以下,我們會在 40 的位置畫上累積總數 (17)。如果在 21 的位置標示 17 是沒有意義的,因為在達到 40 之前,總數還沒累積完成。
繪圖步驟指南
- 準備軸線:
- X 軸代表數據值(例如:分數、身高、時間)。請務必清楚標示,並使用組界上限 (UCB) 作為刻度。
- Y 軸代表累積頻數,範圍從 0 到 \(N\)(總頻數)。
- 標示第一個點(從零開始):
你的曲線必須從累積頻數為零的地方開始。請繪製點 (第一組的組界下限, 0)。
(在上面的例子中,第一個點是 (0, 0))。 - 標示後續點:
繪製累積頻數對應的組界上限 (UCB)。
(使用示例表格:繪製 (20, 5), (40, 17), (60, 37), (80, 47), (100, 50))。 - 連接各點:
課程大綱要求繪製的點應清晰標示(例如用小叉號 'x'),並用平滑曲線連接。
🚨 常見錯誤提醒:切勿用直線連接這些點(像繪製頻數多邊形那樣)。連續變數的累積頻數數據應始終以平滑曲線(Ogive)連接。
我們繪製的是 CF 對 UCB(累積頻數對組界上限)。
記住形狀:一定要畫 S-M-O-O-T-H(平滑)的曲線!
3. 解讀圖表:尋找關鍵統計數據
累積頻數圖的主要目的是快速且直觀地估算位置和離散程度的測量值。
首先,確認總頻數 \(N\)。在我們的例子中,\(N = 50\)。
3.1 中位數 (Median, Q₂)
中位數是中間值;它將數據的下半部分(50%)與上半部分(50%)分開。
第 1 步:找出中位數位置。
中位數位置 = \(\frac{N}{2}\)
(在我們的例子中:位置 = \(\frac{50}{2} = 25\))
第 2 步:讀取數值。
在 CF (Y) 軸上找到位置 (25),畫一條水平線連接到曲線,然後畫一條垂直線向下對應到 數據 (X) 軸。你在 X 軸上讀到的數值就是估算出的中位數。
3.2 四分位數 (Q₁ 和 Q₃) 與四分位距 (IQR)
四分位數將數據分為四個相等的部分(四分之一)。
尋找四分位數:
- 下四分位數 (Q₁):位於 25% 處的數值。
- Q₁ 位置 = \(\frac{N}{4}\) 或 \(0.25 \times N\)
- 上四分位數 (Q₃):位於 75% 處的數值。
- Q₃ 位置 = \(\frac{3N}{4}\) 或 \(0.75 \times N\)
找出 Q₁ 和 Q₃ 的方法與中位數一樣:在 CF 軸上找到對應位置,然後向下對應到 X 軸。
尋找四分位距 (IQR):
IQR 用於衡量中間 50% 數據的分散程度。這是一個非常穩定的離散度指標,因為它不受極端離群值的影響。
$$IQR = Q_3 - Q_1$$
IQR 越大,中間數據的分散程度就越高。
3.3 百分位數 (Percentiles)
百分位數是四分位數概念的推廣。百分位數告訴你數據中小於該特定百分比的數值。
- 第 50 百分位數即為中位數 (Q₂)。
- 第 25 百分位數即為 Q₁。
- 第 75 百分位數即為 Q₃。
尋找第 $k$ 百分位數:
第 $k$ 百分位數位置 = \(\frac{k}{100} \times N\)
示例:要找出 50 名學生的第 80 百分位數 (P₈₀):
位置 = \(\frac{80}{100} \times 50 = 40\)。你只需在 X 軸上讀取對應於 CF 為 40 的數值即可。
- 中位數 (Q₂):中間值 (\(50\%\) 點)
- 下四分位數 (Q₁):\(25\%\) 點
- 上四分位數 (Q₃):\(75\%\) 點
- 四分位距 (IQR):\(Q_3 - Q_1\)
- 向上讀取:從 CF (Y) 軸開始,移至曲線,再向下讀取至數據 (X) 軸。
4. 反向使用圖表
有時題目會要求你找出超過或低於某個數據值的人數或百分比。這時,你需要「反向讀圖」。
反向讀取步驟指南
問題:有多少學生分數低於 50 分?
- 從 X 軸開始:找到分數值 (50)。
- 讀取 CF:從 50 畫一條垂直線向上連接到曲線。
- 讀取結果:畫一條水平線連接到 CF (Y) 軸。你讀到的數值就是分數小於或等於 50 的學生人數。
問題:有多少學生分數超過 80 分?
- 找到「小於」值:在 X 軸上找到 80,並讀取對應的 CF 值(例如根據我們的表格是 47)。
- 從總數中減去:因為 CF (47) 告訴你分數小於或等於 80 的人數,所以分數超過 80 的人數就是總數減去該 CF。
分數 > 80 的人數 = 學生總數 - 80 分處的 CF
分數 > 80 的人數 = \(50 - 47 = 3\) 名學生。
5. 常見問題排解與考試技巧
技巧 1:始終使用 UCB!
如果你的組距寫成 $10-19$、$20-29$,必須先找出組界 (Class Boundaries)(即 $9.5-19.5$、$19.5-29.5$)。即使題目沒有要求找組界(例如數據已經是連續的,如 $0 < x \le 10$),也請務必對著組距的上限值進行標點。
技巧 2:從零開始
確保你的曲線在第一組的組界下限處觸碰到橫軸。如果第一個組距是 $50 \le x < 60$,你的圖表必須從 $x=50, CF=0$ 開始。
技巧 3:平滑曲線是關鍵
連接點的直線會讓你失分。請務必繪製一條單一、連續、平滑的曲線,並準確穿過你標示的所有點('x' 或圓點)。
技巧 4:讀數準確度
讀取數值(尤其是四分位數)時,答案必須精確到網格中最小方格的一半以內。請在圖表上清楚標示你的作圖線(從軸到曲線的水平線和垂直線)。
小知識:累積頻數曲線的斜率(陡峭程度)反映了頻數分佈。越陡峭的部分意味著頻數越高(數據更密集地分佈在該區間)。
- 對著中點標點:錯誤!請對著 UCB 標點。
- 用尺/直線連接:錯誤!必須是平滑曲線 (Ogive)。
- 忘記從 (0, 0) 或 (組界下限, 0) 開始:錯誤!曲線必須從 CF=0 開始。
- 用 N/2 計算 Q₁:錯誤!Q₁ 是 \(\frac{N}{4}\)。計算時請留意分母!
你現在已經掌握了構建和解讀累積頻數圖的所有工具。祝你考試順利!