歡迎來到數據的世界!

大家好!今天我們會深入探討「單變量數據」(One-Variable Data)。這個名稱聽起來可能有點深奧,但其實你在日常生活中一直在運用它。你是否曾經計算過某科的平均分?或者留意過你最喜歡的籃球員得分是否穩定?如果是的話,你其實已經在做數據分析了!

在這一章,我們會學習如何透過數據的「中心位置」(數據的中點在哪裡)和「離散程度」(數據有多分散)來描述一組數字。這些是 SAT「問題解決與數據分析」(Problem-Solving and Data Analysis)部分的核心工具。讓我們開始吧!

1. 集中趨勢:中心位置在哪裡?

當我們面對一大堆數據時,通常想找一個代表性的數字來反映其「典型」數值。我們主要有兩種方法:平均數(Mean)中位數(Median)

平均數(Mean / Average)

平均數就是大眾常說的「平均」。計算方法是將所有數值相加,然後除以數值的總個數。

公式: \(\text{Mean} = \frac{\text{Sum of all values}}{\text{Number of values}}\)

例子: 如果一名學生的三次測驗分數分別是 80、90 和 100,那麼平均數是:\(\frac{80 + 90 + 100}{3} = \frac{270}{3} = 90\)。

比喻: 想像三個小朋友擁有不同數量的糖果。要找平均數,就是把所有糖果放在一起,然後平均分給這三個小朋友。

中位數(Median / 中間數)

中位數是指將數據由小到大排列後,排在最中間的那個數字。

步驟說明:
1. 將你的數字從小到大排列。
2. 如果數值的個數是奇數,中位數就是正中間的那一個。
3. 如果數值的個數是偶數,中位數就是中間那兩個數的平均值。

助記法: 想像馬路中間的「分隔帶」(Median strip),它指的就是正中間的位置!

平均數 vs 中位數:「離群值」陷阱

你知道嗎? 平均數對「離群值」(Outliers,即比其他數字極大或極小的數值)非常敏感,但中位數卻不會受太大影響。

例子: 假設一個房間裡有 5 個人,月薪分別是 \$20,000、\$25,000、\$30,000、\$35,000 和 \$1,000,000。
中位數是 \$30,000(反映了正常的薪金水平)。
平均數卻高達 \$222,000(因為那位百萬富翁,讓每個人看起來都很富有!)。

重點筆記: 如果一組數據中存在極端的離群值,通常用中位數來描述「典型」數值會更準確。

2. 離散程度:數據有多分散?

單靠中心位置是不夠的。我們還需要知道這些數字是緊密靠攏,還是分散得很開。

全距 (Range)

全距是衡量離散程度最簡單的方法。它是最大值與最小值之間的差。

公式: \(\text{Range} = \text{Maximum} - \text{Minimum}\)

專業小貼士: 全距大代表數據非常分散;全距小則代表數據比較穩定且彼此接近。

標準差 (Standard Deviation)

不用擔心! 在 SAT 考試中,你幾乎不需要徒手計算標準差。你只需要理解它的意義

標準差衡量數據點與平均數之間的平均距離。
- 低標準差: 數字都非常接近平均數(表現非常穩定)。
- 高標準差: 數字偏離平均數很遠(變動很大、非常多樣化)。

比喻: 想像兩間薄餅店。A 店每次都在 20-25 分鐘內送達(低標準差);B 店有時 5 分鐘送達,有時卻要 60 分鐘(高標準差)。即使它們的「平均」送貨時間相同,A 店也明顯更穩定可靠。

重點筆記: 全距和標準差都告訴我們數據的變異性(Variability)。數值越高 = 數據越分散。

3. 數據分佈:數據的形狀

當我們將數據繪製成圖表(如直方圖或點圖)時,它會形成一種形狀,稱為分佈(Distribution)

對稱分佈 (Symmetric Distribution)

在對稱分佈中,左邊看起來就像右邊的鏡像(像一個鐘形曲線)。
在這種情況下: \(\text{Mean} \approx \text{Median}\)

偏態分佈 (Skewed Distributions —— 「尾巴」帶路)

有時候數據會有一條向某側延伸的「尾巴」,這稱為「偏態」。

右偏 (Skewed Right): 尾巴(尖端細長部分)在右側。這通常是因為有少數極大的數值將平均數拉高了。
規律: \(\text{Mean} > \text{Median}\)

左偏 (Skewed Left): 尾巴在左側。這發生在有少數極小的數值將平均數拉低時。
規律: \(\text{Mean} < \text{Median}\)

助記法: 想像你在「尾巴」上滑雪,你會滑向哪一邊?如果你滑向右邊,那就是右偏!

4. 快速複習與常見錯誤

快速複習小筆記:
- 平均數 (Mean): 總和除以個數。
- 中位數 (Median): 中間的數(記得先排序!)。
- 全距 (Range): 最大值減最小值。
- 標準差 (SD): 穩定性(低 = 穩定,高 = 分散)。
- 右偏 (Skewed Right): 平均數大於中位數。
- 左偏 (Skewed Left): 平均數小於中位數。

要避免的常見錯誤:

1. 忘記排序: 同學們常在沒有從小到大排列數字的情況下就去找中位數。永遠記得先排序!
2. 混淆平均數與中位數: 如果題目要求「Average」,指的是平均數;如果要求「Middle value」,則是指中位數。
3. 過度糾結標準差計算: 如果你看到兩個點圖,一個數據「擠在中間」,另一個數據「平坦」且分散,那麼平坦的那個標準差較大。不需要任何計算!

最後的鼓勵

你一定做得到的!SAT 的數據分析重點不在於「死計數」,而在於解讀這些數字背後的意義。只要記住:平均數和中位數是關於中心點;全距和標準差是關於分散程度。祝你練習順利!