歡迎來到地理數據的世界!
在地理學中,我們不只是看看山川風景或城市地圖的精美圖片,我們更是「數據偵探」。我們會收集資料,並運用統計技巧來找出規律,從而剖析世界正在發生的變化。別擔心自己不是「數學能手」——只要稍加練習,這些技巧其實很容易掌握,而且能助你在三份 AQA GCSE 考卷中奪得高分!
1. 尋找「中間值」:集中趨勢測量
有時候我們手頭會有一長串數字,例如一個城市 30 天內的降雨量。為了理解這些數據,我們需要找出「平均值」或中心點。
平均數 (Mean)
這就是大多數人平時所說的「平均值」。你需要將所有數值加起來,然後除以數據的總數量。
公式: \(\text{Mean} = \frac{\text{Total Sum of All Values}}{\text{Number of Values}}\)
中位數 (Median)
如果你將所有數據點從小到大排列,中位數就是正中間的那一個。
小撇步:把「中位數 (Median)」想像成高速公路中間的中央分隔帶。它永遠都在中心位置!
注意:如果數據數量的總數是雙數,中位數就是最中間兩個數值的平均值。
眾數與眾數組 (Mode and Modal Class)
眾數 (Mode) 是出現次數最多的數值。如果你的數據已分組(例如「0-10mm 降雨量」和「11-20mm 降雨量」),出現次數最多的那一組就稱為眾數組 (Modal Class)。
快速回顧:
- 平均數 (Mean): 加總後除以數量。
- 中位數 (Median): 排列後找中間。
- 眾數 (Mode): 最受歡迎(最常出現)的數值。
2. 測量「離散程度」:全距與四分位數
了解中間值固然很好,但我們也需要知道數據的「分散程度」。例如,兩個城市的平均氣溫可能都是 \(15^\circ C\),但其中一個城市全年氣溫穩定,另一個城市卻有著寒冷的冬天和炎熱的夏天。
全距 (Range)
全距是最大值與最小值之間的差。
公式: \(\text{Range} = \text{Highest Value} - \text{Lowest Value}\)
四分位數與四分位距 (IQR)
有時候,全距可能會產生誤導,因為一個「異常」的結果(極端值/離群值,outlier)會讓分散程度看起來比實際情況大得多。為了解決這個問題,我們會使用四分位數 (Quartiles)。
想像你排序好的數據是一塊巧克力棒。你將它對半折斷(這是中位數),然後再將兩半各對折。現在你有了四個部分(四分位):
- 下四分位數 (LQ): 處於 25% 的位置。
- 上四分位數 (UQ): 處於 75% 的位置。
- 四分位距 (IQR): 下四分位數與上四分位數之間的距離。
公式: \(\text{IQR} = \text{UQ} - \text{LQ}\)
為什麼要用它?因為它只關注中間 50% 的數據,所以會忽略那些「古怪」的極端值!
重點總結:全距展示了整體的離散程度;而四分位距 (IQR) 則展示了「典型」數據的分散情況。
3. 百分比與百分位數
地理學家使用百分比來比較不同規模的事物,例如比較小村莊與大城市的人口增長率。
百分比增加與減少
這是考試中非常常見的問題。請使用這個簡單公式:
公式: \(\text{Percentage Change} = \frac{\text{New Value} - \text{Old Value}}{\text{Old Value}} \times 100\)
例子:如果一片森林原本是 50 \(km^2\),現在變成了 40 \(km^2\),變化量就是 \( -10 \)。計算如下:\(\frac{-10}{50} \times 100 = -20\%\)。這代表減少了 20%!
百分位數 (Percentiles)
百分位數告訴你某個數值在整體中的排位。如果一個城市的污染程度處於第 90 個百分位,意味著它比其他 90% 的城市污染更嚴重。第 50 個百分位數與中位數是一樣的。
4. 累積頻率 (Cumulative Frequency)
累積頻率其實就是「累加總數」的專業說法。
想像你在海灘上數小石子。第一公尺內你找到了 5 顆。第二公尺內你找到了 8 顆。
- 第二公尺的頻率是 8。
- 但累積頻率是 13(之前的 5 顆 + 新找到的 8 顆)。
我們會將這些數據繪製成圖表,通常看起來像一個長長的「S」型曲線。這能幫助我們透過觀察縱軸上的 50%、25% 和 75% 點,輕鬆找出中位數和四分位數。
5. 雙變量數據:觀察關聯性
雙變量數據 (Bivariate data) 是指包含兩個變數的數據(例如「氣溫」與「冰淇淋銷量」)。我們使用散點圖 (Scatter Plots) 來觀察它們是否相關。
趨勢線與相關性
觀察散點圖時,數據點是否有呈現出某種趨勢?
- 正相關 (Positive Correlation): 一個數值上升,另一個也上升(例如:降雨量越多 = 河流水位越高)。
- 負相關 (Negative Correlation): 一個數值上升,另一個則下降(例如:海拔越高 = 氣溫越低)。
- 無相關 (No Correlation): 數據點雜亂無章!沒有任何關聯。
最佳擬合線 (Line of Best Fit)
這是一條穿過散點圖中間的直線。如果它沒有經過每一個點,請不要擔心!這條線上下方應該要有大致相同數量的點。
內插法與外推法
- 內插法 (Interpolation): 在現有數據範圍「之內」預測數值。這種做法通常相當準確。
- 外推法 (Extrapolation): 延長最佳擬合線來預測數據範圍「之外」的數值。請小心!這是有風險的,因為趨勢未來可能會改變。
快速回顧區:
- 雙變量: 比較兩組數據。
- 最佳擬合線: 顯示總體趨勢。
- 外推法: 預測未知數值(有風險!)。
6. 批判性的地理學家:選擇性數據
你知道嗎?統計數據有時會被用來誤導大眾!有時候,人們只會展示支持他們論點的數據。這稱為選擇性呈現 (selective presentation)。
在考試中看到圖表時,請自我提問:
- 圖表的刻度是從零開始嗎?(如果不是,這可能會讓微小的變化看起來非常巨大!)
- 是否有數據缺失?
- 提供數據的人是否有偏見?
重點總結:在相信圖表所顯示的資訊前,請務必仔細檢查軸線和數據來源!