歡迎來到數據呈現的世界!

在這一章,我們將不再只是盯著一堆數字,而是要為數據繪製「圖畫」。統計本質上就是用數字說故事,而你的任務就是讓這個故事既清晰又精準。無論是在分析運動員的身高,還是人們擁有的寵物數量,你呈現數據的方式決定了他人對數據的理解程度。如果某些圖表初看之下讓你感到壓力,別擔心——我們會一步步為你拆解!

1. 基本構件:數據類型

在繪製圖表前,我們必須先了解正在處理的是哪種數據。這就像為不同的食物選擇合適的容器;你總不會用平底盤子來裝湯吧!

分類數據 (Categorical Data): 這些是「標籤」或「名稱」。例如:眼睛顏色、最喜歡的披薩配料或汽車品牌。

離散數據 (Discrete Data): 這些是透過「數算」得出的數值。它們通常有固定的數值,不存在中間值。例如:你有多少個兄弟姊妹(你不可能有 2.4 個兄弟姊妹吧!)。

連續數據 (Continuous Data): 這些是透過「測量」得出的數值。它們在一個範圍內可以是任何數值。例如:你的身高、跑 100 米所需的時間,或是一個蘋果的重量。

排序數據 (Ranked Data): 具有特定順序的數據。例如:賽跑的名次(第一名、第二名、第三名)。

快速檢閱: 隨時問自己:「我是在數算它,還是測量它?」數算通常代表離散數據,而測量通常代表連續數據

重點提示: 辨識數據類型是選擇正確圖表的第一步。你總不能為眼睛顏色畫一個直方圖吧!

2. 單變量數據的標準圖表

呈現數據的方法有很多種,讓我們來看看在 MEI 考試中最常遇到的幾種。

垂直線圖與長條圖 (Vertical Line Charts and Bar Charts)

用於分類數據離散數據。每一條柱或線代表一個類別。高度顯示的是頻數 (Frequency)(即該項目出現的次數)。

莖葉圖 (Stem-and-Leaf Diagrams)

這類圖表非常實用,因為它們能展示每一個原始數據,同時外觀上看起來就像橫向的長條圖。 例如:數字 21, 23, 23, 28 的「莖」是 2,「葉」則是 1, 3, 3, 8。
常見錯誤警示: 千萬別忘了加上圖例 (Key)!如果沒有圖例(例如:2 | 1 代表 21),你的圖表就只是一堆雜亂無章的數字。

圓形圖 (Pie Charts)

用於展示「整體」是如何分割成「部分」的。每個扇形的角度與頻數成正比。 計算角度的公式:\( \text{Angle} = \frac{\text{Frequency}}{\text{Total Frequency}} \times 360^\circ \)。
你知道嗎? MEI 可能會考「比較圓形圖」。如果你有兩個圓形圖,而其中一個代表的總體樣本數較大,那麼它的面積應該比另一個大。

點圖 (Dot Plots)

想像一下長條圖,但不是用實心的長條,而是將點堆疊在一起。每一個點代表一個數據。這對於小型數據集非常完美,能清楚地呈現每一個數值。

重點提示: 離散數據使用長條圖/線圖;當你想保留原始數值時,使用莖葉圖。

3. 直方圖:面積法則

直方圖用於已分組為「組別」的連續數據。它們看起來像長條圖,但有一個巨大的區別:面積等於頻數。

別讓這一點絆倒你!在標準長條圖中,你只需要看高度;但在直方圖中,如果各組柱體的寬度不同,單看高度是無法說明全貌的。

頻數密度 (Frequency Density)

為了正確繪製直方圖,我們在縱軸(y 軸)使用頻數密度
公式為:\( \text{Frequency Density} = \frac{\text{Frequency}}{\text{Class Width}} \)
這能確保:\( \text{Area} = \text{Class Width} \times \text{Frequency Density} = \text{Frequency} \)。

直方圖繪製步驟:
1. 找出每一組的組距 (Class Width)(上邊界 - 下邊界)。
2. 計算每一組的頻數密度
3. 繪製坐標軸,將頻數密度放在縱軸上。
4. 繪製柱體。請確保連續數據的柱體之間沒有空隙

鼓勵一下: 如果卡住了,記住:寬度乘以高度等於箱子裡面的數量!

重點提示: 對於直方圖,高度 = 頻數密度,面積 = 頻數。

4. 累積頻數與箱形圖

這兩者就像好朋友,它們共同合作來展示數據的「分佈」與「位置」。

累積頻數 (Cumulative Frequency)

這是一種「累計總和」。當你處理數據時,將頻數不斷相加。繪圖時,總是將累積頻數對應組上限 (Upper Class Boundary)。圖形看起來應該像一個平滑且拉長的「S」形曲線。

箱形圖 (Box-and-Whisker Diagrams)

箱形圖利用五個關鍵數值來概括數據:
1. 最小值 (Minimum value)(左側觸鬚的起點)
2. 下四分位數 (\(Q_1\))(箱子的起點)
3. 中位數 (\(Q_2\))(箱子中間的線)
4. 上四分位數 (\(Q_3\))(箱子的終點)
5. 最大值 (Maximum value)(右側觸鬚的終點)

類比: 把箱形圖想像成一本書的摘要。它不會告訴你每一個字,但它會告訴你故事從哪開始、中間在哪裡,以及最精彩的部分(中間 50% 的數據)發生在哪裡。

重點提示: 累積頻數能幫助你找出中位數與四分位數,然後你就可以用這些數值來畫箱形圖。

5. 描述形狀(分佈)

當你看著一張圖表時,它呈現什麼狀態?我們使用這些術語來描述分佈的形狀:

單峰 (Unimodal): 只有一個明顯的頂峰(眾數)。
雙峰 (Bimodal): 有兩個明顯的頂峰(像駱駝的駝峰)。
對稱 (Symmetrical): 左側是右側的鏡像。
偏態 (Skewed): 圖表的「尾巴」被拉向一側。

理解偏態

這點可能會讓人困惑!要記住哪個是哪個,請看尾巴 (tail) 指向哪,而不是看峰值在哪。
正偏態 (Positive Skew): 「尾巴」指向右側(正向)。大多數數據集中在左側。
負偏態 (Negative Skew): 「尾巴」指向左側(負向)。大多數數據集中在右側。

記憶法: 如果你用串燒棒穿過一塊肉,「長長的棒子」就是尾巴。如果這根長棒指向數值大的方向,那就是正偏態!

重點提示: 偏態跟隨尾巴的方向。尾巴在右 = 正偏態。

6. 選擇與評鑑圖表

在考試中,你可能會被問到為什麼某種圖表比另一種更好,或者被要求找出圖表的錯誤。請使用這個檢查清單:

1. 比例 (Scale): 比例是否一致且合理?
2. 標籤 (Labels): 坐標軸是否有標註單位(例如:「身高 / cm」)?
3. 適當性 (Appropriateness): 連續數據是否使用了直方圖?離散數據是否使用了長條圖?
4. 清晰度 (Clarity): 圖表是否讓數據更容易理解,還是看起來雜亂無章?

時間序列圖 (Time Series Graphs): 如果你在觀察隨時間變化的數據(例如一週內的氣溫),請使用線圖,並將時間放在橫軸上。這有助於你找出趨勢(數據整體是在上升還是下降?)。

重點提示: 一張好的圖表應該是誠實且清晰的。務必檢查標籤、單位,以及該數據類型所對應的正確圖表。

總結複習箱

離散數據: 使用長條圖或莖葉圖。
連續數據: 使用直方圖(面積 = 頻數)。
累計數據: 使用累積頻數圖來尋找四分位數。
總結分佈: 使用箱形圖(最小值, \(Q_1\), 中位數, \(Q_3\), 最大值)。
偏態: 跟著尾巴走!