統計圖表與數據可視化(IGCSE 0580 數學)
你好,未來的數據分析師!歡迎來到數據可視化的世界。數字固然重要,但單看枯燥的列表難免會讓人眼花撩亂。本章的重點就是將這些沉悶的清單轉化為精美且資訊豐富的圖表!這些圖表能幫助我們快速詮釋數據,並作出精明的結論。別擔心自己沒有藝術細胞;我們只需要掌握如何準確繪製和解讀它們即可!
認識數據類型:離散型與連續型
在繪製圖表之前,我們必須先了解手中的數據類型。請回顧統計章節(C10.3 / E10.3)中的定義:
- 離散數據(Discrete Data): 只能取特定、固定數值(通常為整數)的數據,通常是透過「數算」得出的。
例子:學生擁有的兄弟姐妹人數(你不可能有 2.5 個兄弟姐妹)。 - 連續數據(Continuous Data): 在一定範圍內可以取任何數值的數據,通常是透過「測量」得出的。
例子:身高、體重或溫度。(註:C10.6 中的大多數圖表主要處理離散數據或分類數據。)
小貼士: 離散數據使用獨立的長條(如標準長條圖)。連續數據通常需要直方圖(Histogram)等方法(這屬於 0580 Extended 課程範圍,但不在本處 C10.6/E10.6 的討論範疇內)。
1. 長條圖(Bar Charts)
長條圖是表示數據最常見的方法之一。它使用矩形長條,長條的長度(或高度)與頻數(Frequency,即某個項目出現的次數)成正比。
繪製簡易長條圖(C10.6/E10.6(a))
關鍵要素:
- 長條通常垂直繪製。
- 長條之間必須有相等的間距。
- 坐標軸必須清晰標註,並具備合適且一致的比例尺。
例子:展示 50 名學生最喜愛的運動。
「運動」類別(足球、欖球、網球)放在橫軸(x 軸),而「頻數」(學生人數)放在縱軸(y 軸)。
組合式(堆疊)長條圖(Composite Bar Charts)
組合式長條圖將不同的組成部分「堆疊」在同一個長條內。它同時展示了總頻數以及每個子類別所佔的比例。
想像成「夾層蛋糕」: 整個長條代表該類別的總人數,而不同的分層則是該類別內的小組成員。
重要: 你必須包含一個圖例(Key/Legend),以說明堆疊中每種顏色或圖案代表什麼。
雙重(並排)長條圖(Dual Bar Charts)
當你需要針對相同類別比較兩組不同的數據集時,會使用雙重長條圖並排比較。
例子:比較「產品 A」和「產品 B」在四個月內的銷售數據。
對於每個月,你會畫出兩個緊鄰的長條(一個代表 A,一個代表 B)。
重要: 與組合式圖表一樣,清晰的圖例對於區分兩組數據至關重要。
長條圖重點: 長條之間必須有間距,比例尺必須一致;若涉及複雜的長條(堆疊或並排),務必加上圖例!
2. 圓形圖(Pie Charts)
圓形圖(C10.6/E10.6(b))是用於顯示整體數量如何劃分為各部分的圓形圖表。整個圓代表數據的 100% 或 360°。
想像成「披薩」: 整個披薩是你的總數據集,每一片代表一個類別。
計算圓形圖的角度(核心技能!)
圓形圖中每個扇形(切片)的大小與其代表的頻數成正比。由於圓周總計為 360°,我們根據總頻數來計算每個類別的角度。
計算步驟:
- 找出總頻數(Total Frequency)(將所有數值加總)。
- 使用以下公式計算每個類別的角度:
$$ \text{角度} = \frac{\text{該類別的頻數}}{\text{總頻數}} \times 360^{\circ} $$
例子:若 50 名學生中有 10 人選擇「紅色」作為最愛顏色:
\( \text{紅色的角度} = \frac{10}{50} \times 360^{\circ} \)
\( \text{紅色的角度} = 0.2 \times 360^{\circ} = 72^{\circ} \)
常見錯誤: 務必檢查計算出的角度總和是否為 360°。如果不對,說明你的計算出錯了!
圓形圖重點: 圓形圖顯示的是比例。你必須根據該類別在總數中所佔的份額來計算其對應的圓心角。
3. 象形圖(Pictograms)
象形圖(C10.6/E10.6(c))使用簡單的圖像或符號來表示頻數。
黃金法則:圖例(Key)!
每個象形圖都必須包含一個清晰的圖例,解釋一個符號代表的具體數量。
例子:如果象形圖顯示賣出的蘋果數量,圖例可能寫:
圖例: \( \text{一個蘋果符號} = 10 \text{ 個蘋果} \)
如果頻數是 35,你就要畫 3 個完整的蘋果符號和一個半個蘋果的符號。確保你畫的符號容易識別且能方便切割出分數部分。
你知道嗎? 象形圖非常適合向大眾展示數據,即使是那些對複雜圖表感到頭痛的人也能一目了然!
象形圖重點: 必須包含清晰的圖例來定義符號價值。準備好在需要時繪製半個或四分之一個符號。
4. 莖葉圖(Stem-and-Leaf Diagrams)
莖葉圖(C10.6/E10.6(d))是一種整理數值數據的絕佳方式,因為它既保留了原始數據,又能展示數據的分佈形態。
想像你收集了 20 名學生的考試分數:
45, 61, 68, 49, 70, 72, 83, 61, 55, 59, 78, 81, 74, 60, 52, 53, 67, 70, 60, 75
繪製莖葉圖(步驟說明)
- 確定莖與葉:
莖(Stem)通常是首位數字(例如十位數或百位數)。
葉(Leaf)通常是末位數字(例如個位數)。
針對上述分數,莖為十位數(4, 5, 6, 7, 8),葉為個位數。 - 草擬圖表(未排序):
4 | 5, 9
5 | 5, 9, 2, 3
6 | 1, 8, 1, 0, 7, 0
7 | 0, 2, 8, 4, 0, 5
8 | 3, 1 - 葉子排序(關鍵步驟!): 每行的葉子必須按升序排列(從小到大)。
4 | 5, 9
5 | 2, 3, 5, 9
6 | 0, 0, 1, 1, 7, 8
7 | 0, 0, 2, 4, 5, 8
8 | 1, 3 - 包含圖例(必備): 圖例告訴讀者如何解讀數字。
圖例: 5 | 2 代表 52(分)
溫馨提示: 葉子的順序非常關鍵!如果忘記排序,你的圖表就是錯誤的。務必在圖表旁註明圖例。
解讀莖葉圖:
此圖清晰展示了分佈情況。你可以看出大多數學生的分數落在 60 到 79 分之間。你還可以從有序列表中輕鬆找出眾數(出現最多次的數)和中位數(中間的數)。
莖葉圖重點: 它既展示分佈又保留原始數值。必須排序並包含圖例。
5. 簡單頻數分佈表
簡單頻數分佈(C10.6/E10.6(e))通常是我們在繪製圖表前製作的表格,通常包含劃記(Tally)。這是總結數據最簡單的方法。
劃記表與頻數表(C10.1):
這涉及計算每個數值或類別出現的次數。這個原始計數就是頻數(Frequency)。
| 類別 | 劃記 | 頻數 |
| --- | --- | --- |
| 藍色 | IIIII I | 6 |
| 綠色 | IIII | 4 |
我們利用這些表格整理數據,進而計算平均值(平均數、眾數、中位數)或繪製上述提到的圖表(長條圖、圓形圖等)。
重點: 簡單頻數分佈是所有統計圖表的基石。它列出了類別以及每個類別的計數(頻數)。
總結:解讀與比較數據(C10.2 / E10.2)
圖表的最終目的是解讀數據並推論結論。在考試中,你經常被要求比較兩個圖表或兩組數據。
比較數據集時,主要看兩點:
- 平均值(集中趨勢): 數據的中間位置在哪裡?
例子:「A 組的平均值較高,說明 A 組學生整體表現較好。」 - 離散程度(全距/四分位距): 數據的一致性如何,還是分散得很開?
例子:「B 組的全距較小,意味著他們的成績更加穩定。」
重要提醒(C10.2.3): 必須時刻意識到推論的局限性。樣本數過小或選擇偏差意味著你的結論可能無法推廣到整個總體。
繼續練習準確、整潔地繪製這些圖表——特別是圓形圖的計算和莖葉圖的排序。你一定做得到的!