Statistical skills - Geography 8035 - AQA GCSE

歡迎來到地理數據的世界！

在地理學中，我們不只是看看山川風景或城市地圖的精美圖片，我們更是「數據偵探」。我們會收集資料，並運用統計技巧來找出規律，從而剖析世界正在發生的變化。別擔心自己不是「數學能手」——只要稍加練習，這些技巧其實很容易掌握，而且能助你在三份 AQA GCSE 考卷中奪得高分！

1. 尋找「中間值」：集中趨勢測量

有時候我們手頭會有一長串數字，例如一個城市 30 天內的降雨量。為了理解這些數據，我們需要找出「平均值」或中心點。

平均數 (Mean)

這就是大多數人平時所說的「平均值」。你需要將所有數值加起來，然後除以數據的總數量。

公式： \(\text{Mean} = \frac{\text{Total Sum of All Values}}{\text{Number of Values}}\)

中位數 (Median)

如果你將所有數據點從小到大排列，中位數就是正中間的那一個。

小撇步：把「中位數 (Median)」想像成高速公路中間的中央分隔帶。它永遠都在中心位置！

注意：如果數據數量的總數是雙數，中位數就是最中間兩個數值的平均值。

眾數與眾數組 (Mode and Modal Class)

眾數 (Mode) 是出現次數最多的數值。如果你的數據已分組（例如「0-10mm 降雨量」和「11-20mm 降雨量」），出現次數最多的那一組就稱為眾數組 (Modal Class)。

快速回顧：
- 平均數 (Mean)： 加總後除以數量。
- 中位數 (Median)： 排列後找中間。
- 眾數 (Mode)： 最受歡迎（最常出現）的數值。

2. 測量「離散程度」：全距與四分位數

了解中間值固然很好，但我們也需要知道數據的「分散程度」。例如，兩個城市的平均氣溫可能都是 \(15^\circ C\)，但其中一個城市全年氣溫穩定，另一個城市卻有著寒冷的冬天和炎熱的夏天。

全距 (Range)

全距是最大值與最小值之間的差。

公式： \(\text{Range} = \text{Highest Value} - \text{Lowest Value}\)

四分位數與四分位距 (IQR)

有時候，全距可能會產生誤導，因為一個「異常」的結果（極端值/離群值，outlier）會讓分散程度看起來比實際情況大得多。為了解決這個問題，我們會使用四分位數 (Quartiles)。

想像你排序好的數據是一塊巧克力棒。你將它對半折斷（這是中位數），然後再將兩半各對折。現在你有了四個部分（四分位）：

- 下四分位數 (LQ)： 處於 25% 的位置。
- 上四分位數 (UQ)： 處於 75% 的位置。
- 四分位距 (IQR)： 下四分位數與上四分位數之間的距離。

公式： \(\text{IQR} = \text{UQ} - \text{LQ}\)

為什麼要用它？因為它只關注中間 50% 的數據，所以會忽略那些「古怪」的極端值！

重點總結：全距展示了整體的離散程度；而四分位距 (IQR) 則展示了「典型」數據的分散情況。

3. 百分比與百分位數

地理學家使用百分比來比較不同規模的事物，例如比較小村莊與大城市的人口增長率。

百分比增加與減少

這是考試中非常常見的問題。請使用這個簡單公式：

公式： \(\text{Percentage Change} = \frac{\text{New Value} - \text{Old Value}}{\text{Old Value}} \times 100\)

例子：如果一片森林原本是 50 \(km^2\)，現在變成了 40 \(km^2\)，變化量就是 \( -10 \)。計算如下：\(\frac{-10}{50} \times 100 = -20\%\)。這代表減少了 20%！

百分位數 (Percentiles)

百分位數告訴你某個數值在整體中的排位。如果一個城市的污染程度處於第 90 個百分位，意味著它比其他 90% 的城市污染更嚴重。第 50 個百分位數與中位數是一樣的。

4. 累積頻率 (Cumulative Frequency)

累積頻率其實就是「累加總數」的專業說法。

想像你在海灘上數小石子。第一公尺內你找到了 5 顆。第二公尺內你找到了 8 顆。
- 第二公尺的頻率是 8。
- 但累積頻率是 13（之前的 5 顆 + 新找到的 8 顆）。

我們會將這些數據繪製成圖表，通常看起來像一個長長的「S」型曲線。這能幫助我們透過觀察縱軸上的 50%、25% 和 75% 點，輕鬆找出中位數和四分位數。

5. 雙變量數據：觀察關聯性

雙變量數據 (Bivariate data) 是指包含兩個變數的數據（例如「氣溫」與「冰淇淋銷量」）。我們使用散點圖 (Scatter Plots) 來觀察它們是否相關。

趨勢線與相關性

觀察散點圖時，數據點是否有呈現出某種趨勢？

- 正相關 (Positive Correlation)： 一個數值上升，另一個也上升（例如：降雨量越多 = 河流水位越高）。
- 負相關 (Negative Correlation)： 一個數值上升，另一個則下降（例如：海拔越高 = 氣溫越低）。
- 無相關 (No Correlation)： 數據點雜亂無章！沒有任何關聯。

最佳擬合線 (Line of Best Fit)

這是一條穿過散點圖中間的直線。如果它沒有經過每一個點，請不要擔心！這條線上下方應該要有大致相同數量的點。

內插法與外推法

- 內插法 (Interpolation)： 在現有數據範圍「之內」預測數值。這種做法通常相當準確。
- 外推法 (Extrapolation)： 延長最佳擬合線來預測數據範圍「之外」的數值。請小心！這是有風險的，因為趨勢未來可能會改變。

快速回顧區：
- 雙變量： 比較兩組數據。
- 最佳擬合線： 顯示總體趨勢。
- 外推法： 預測未知數值（有風險！）。

6. 批判性的地理學家：選擇性數據

你知道嗎？統計數據有時會被用來誤導大眾！有時候，人們只會展示支持他們論點的數據。這稱為選擇性呈現 (selective presentation)。

在考試中看到圖表時，請自我提問：

- 圖表的刻度是從零開始嗎？（如果不是，這可能會讓微小的變化看起來非常巨大！）
- 是否有數據缺失？
- 提供數據的人是否有偏見？

重點總結：在相信圖表所顯示的資訊前，請務必仔細檢查軸線和數據來源！

你已經完成了統計技巧的筆記！記住，學習這些技巧的最佳方法就是拿起計算機，多做幾道練習題。你一定可以做到的！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。