歡迎來到統計抽樣的世界!

你有沒有想過,為什麼新聞台能在點算所有選票之前,就預測出選舉結果?或者科學家如何在不對地球上每個人進行測試的情況下,就知道新藥是否有效?答案就是統計抽樣 (Statistical Sampling)

在本章中,我們將學習如何挑選一小群人(或事物)來代表一個更大的群體。這是統計學中至關重要的技能,因為在現實世界中,我們很少有足夠的時間或金錢去詢問每一個人所有事情。如果起初有些術語聽起來很「數學化」,不用擔心——我們會用像煲湯和購物一樣簡單的例子為大家拆解!

1. 大局觀:母體與樣本 (Population vs. Sample)

在開始挑選群體之前,我們需要知道我們正在從什麼中進行挑選,以及為什麼要這樣做。

關鍵術語

  • 母體 (Population):你感興趣的對象或事物的全體。例子:你學校裡的所有學生。
  • 樣本 (Sample):從母體中挑選出來以代表該母體的一小群對象。例子:午飯時間在食堂隨機選出的 20 名學生。
  • 普查 (Census):當你收集母體中每一個成員的數據時。

「煲湯」類比

想像你正在煮一大鍋蔬菜湯。你想知道它是否需要加更多鹽。你不會把整鍋湯都喝掉(那是普查)。相反,你會攪拌均勻並喝一勺(這就是樣本)。如果那一勺喝起來夠鹹,你就會推論 (infer)整鍋湯都夠鹹了。

你知道嗎?

英國政府每 10 年進行一次人口普查。這是一項龐大的工程,旨在接觸全國居住的每一個人!

快速回顧:如果你想知道森林中樹木的平均高度,「母體」就是森林裡所有的樹,「樣本」就是你實際測量的 50 棵樹。

2. 進行推論 (Making Inferences)

抽樣的全部意義在於做出推論。這只是一個花俏的詞,意思是「根據你的樣本,對母體做出合理的猜測」。

如果你的樣本具有「代表性」(意味著它看起來像是母體的縮小版),你的猜測就會準確。如果你的樣本存在偏差 (biased)(它不能很好地代表群體),你的猜測就會出錯。

例子:如果你只問學校籃球隊的成員關於他們的身高,你可能會「推論」全校每個學生都有 6 呎高。這就是一個有偏差的樣本!

3. 抽樣技巧:你需要「操作」的方法

OCR 課程大綱要求你理解並能夠運用這兩種特定方法:

A. 簡單隨機抽樣 (Simple Random Sampling)

在這種方法中,母體中的每個成員都有均等的機會被選中。這就像把每個人的名字放進一個巨大的帽子裡,然後隨機抽出來一樣。

操作方法:

  1. 為母體的每個成員分配一個唯一的編號。
  2. 使用隨機數生成器(在計算機或電腦上)來選取編號。
  3. 將這些編號對應回相應的人員或物品。

優點:完全公平,消除了偏差。

缺點:如果母體非常大,操作起來會很困難且耗時(試想一下要給倫敦的每個人編號!)。

B. 機會抽樣 (Opportunity Sampling / Convenience Sampling)

這只是選取當時在場且符合你條件的人。例子:站在超市外面,詢問走過的前 10 個人。

優點:非常簡單、快捷且便宜。

缺點:極有可能產生偏差。你只遇到了剛好在那特定時間出現在那裡的人。

關鍵總結:隨機抽樣公平但困難;機會抽樣簡單但有偏差。

4. 抽樣技巧:你需要「評論」的方法

對於這些方法,你不需要進行計算,但你必須能夠解釋它們是什麼,以及為什麼它們在特定情況下是好是壞。

A. 系統抽樣 (Systematic Sampling)

從列表中按固定的間隔選擇項目。例子:從學校名冊中選出每第 10 個人。

  • 評論:速度快,但如果列表中存在隱藏的規律,則可能會產生偏差。

B. 分層抽樣 (Stratified Sampling)

將母體根據特徵(如年齡或性別)劃分為不同群組(層,strata),然後從每個群組中按比例進行隨機抽樣。

  • 評論:這是「黃金標準」。它確保每個子群體都能得到公平的代表。然而,它很複雜,因為你需要預先知道母體的精確結構。

C. 配額抽樣 (Quota Sampling)

與分層抽樣相似,但研究人員被要求在特定群組中找到一定數量的受訪者。例子:「去採訪 20 名男性和 20 名女性。」

  • 評論:一旦研究人員找到了 20 名男性,他們就不會再詢問其他男性。這通常用於街頭市場研究。速度很快,但並非真正的隨機,因為研究人員自行決定與誰交談。

D. 集群抽樣 (Cluster Sampling)

將母體劃分為「集群」(通常基於地理位置),然後隨機選擇一個或多個集群進行全面研究。例子:為了研究英國學生,你隨機挑選 5 所學校,並採訪其中所有的學生。

  • 評論:比在全國各地奔波便宜得多,但集群可能無法代表整個母體(例如,富裕地區的學校無法代表所有英國學校)。

5. 常見陷阱與評論技巧

在考試中,你可能會被要求「評論」一種抽樣方法。以下是需要注意的事項:

變異 (抽樣誤差)

重點:不同的樣本會導致對母體得出不同的結論。這是自然的!即使你使用了完美的隨機抽樣,兩組不同的 50 名學生也會給出略有不同的平均身高。這稱為抽樣變異 (Sampling Variation)

需要避免的常見錯誤:

  • 混淆普查與樣本:記住,普查是每一個人;樣本是一部分
  • 忽略偏差:總是檢查該方法是否排除了特定群體。(例如:「他們只抽樣了有座機電話的人——這排除掉了年輕人!」)。
  • 樣本大小:如果樣本太小(例如只詢問 2 個人),結果是不可靠的。

記憶輔助:「S」開頭的方法

如果你記不住名字,可以想想這 4 個 S

1. Simple Random(帽子抽籤法)
2. Systematic(每第 10 個)
3. Stratified(比例分配)
4. Sample(小組代表)

6. 複習總結表

方法:簡單隨機抽樣 (Simple Random)
適用於:追求公平並避免偏差。

方法:機會抽樣 (Opportunity)
適用於:速度快且預算有限。

方法:分層抽樣 (Stratified)
適用於:確保母體中的小群體得到充分代表。

方法:配額抽樣 (Quota)
適用於:快速、有針對性的市場研究。

最後鼓勵:統計學不僅僅是關於數字,更是關於講述一個故事。當你看抽樣題目時,問自己:「這個故事對母體中的每個人公平嗎?」 如果你能回答這個問題,你就已經拿到了一半的分數,距離 A 級不遠了!