歡迎來到統計抽樣的世界!

在本章中,我們將探索數學家和科學家是如何收集有關這個世界的資訊。無論是預測選舉結果,還是測試新藥是否有效,我們通常都沒有時間或金錢去詢問地球上的每一個人。這就是抽樣 (Sampling) 的用武之地!

閱讀完這些筆記後,你將能理解「母體」與「樣本」之間的區別,並準確地知道如何挑選合適的研究對象。如果一開始覺得統計學有點「文字遊戲」的感覺,別擔心——一旦你看透了它們與現實世界的聯繫,你會發現它其實非常有邏輯。

1. 大局觀:母體 vs. 樣本

在我們開始收集數據之前,我們需要定義我們實際上對「誰」或「什麼」感興趣。在 AQA Mathematics 7357 中,我們使用兩個非常具體的術語:

母體 (Population)

母體是指你想研究的群體中的每一位成員。如果你想知道學校學生的平均身高,那麼母體就是該校註冊的每一位學生。

樣本 (Sample)

樣本是從母體中挑選出來的一小部分群體。如果你只測量了學校中 20 名學生的身高,這 20 名學生就是你的樣本

比喻:想像你正在煮一大鍋蔬菜湯。母體就是整鍋湯。為了檢查是否需要多加點鹽,你不需要把整鍋湯喝完!相反,你只需要喝一口湯匙。那一小匙就是你的樣本

為什麼我們要使用樣本?

我們使用樣本是因為研究整個母體通常會遇到以下情況:
1. 成本太高(想像一下要花錢採訪英國的每一個人!);
2. 太過耗時
3. 不可能做到(如果你要測試燈泡的「壽命」,你無法測試每一個燈泡,因為這樣做會把燈泡全部弄壞!)。

重點速覽:
母體 (Population):整個群體。
樣本 (Sample):母體的一部分。
普查 (Census):當你實際觀察母體中的每一位成員時(例如英國政府每 10 年進行一次的人口普查)。

2. 進行推論 (Making Inferences)

抽樣的最終目的是為了進行推論 (Inference)。這是一個高級的說法,意思是「根據樣本對母體做出有根據的猜測」。

如果你那一湯匙的湯(樣本)喝起來太鹹,你會推論整鍋湯(母體)都太鹹了。在考試中,你可能會被要求解釋樣本告訴了我們什麼。你應該使用諸如「樣本顯示…… (the sample suggests that...)」或「我們可以從樣本推斷出…… (we can infer from the sample that...)」這樣的句式。

重要提示:不同的樣本可能會導致不同的結論!如果你的樣本恰好只包含學校裡最高的學生,那麼你對全校平均身高的「推論」就會出錯。這被稱為抽樣誤差 (Sampling error)

3. 抽樣方法

AQA 課程要求你理解兩種主要的樣本選取方式。你如何選擇樣本至關重要,因為它決定了你的結果是否會產生偏差 (Bias)(即不公平或單一傾向)。

方法 A:簡單隨機抽樣 (Simple Random Sampling)

簡單隨機抽樣中,母體的每一位成員都有相同的機會被選中。就像把所有人的名字寫在紙條上放入一個大帽子裡,然後一個一個抽出來一樣。

具體做法(步驟):

1. 為母體的每一位成員分配一個唯一的編號(這份列表稱為抽樣框 (Sampling frame))。
2. 使用亂數產生器(在計算機或電腦上)來選取編號。
3. 對應這些編號的人員/項目就是你的樣本。

優點:完全無偏 (Unbiased)。沒有人是因為研究者的偏好而被選中的。
缺點:你需要一份完整的母體名單,這可能很難獲得。如果母體分散在巨大的區域,它也可能不切實際。

方法 B:機會抽樣 (Opportunity Sampling)

機會抽樣(有時稱為便利抽樣)就是簡單地挑選當時有空且符合你條件的人。例如,如果你站在超級市場門口,詢問前 10 個經過的人進行調查,這就是在使用機會抽樣。

優點:快速、容易且便宜。你不需要一份完整的母體名單。
缺點:極有可能產生偏差。如果你站在健身房門口,你的樣本可能會比一般大眾更「健壯」。它無法很好地代表整個母體。

記憶輔助:把「機會」理解為「利用身邊任何人的機會」。

4. 批判樣本

在 Paper 3 中,你經常會被要求批判 (Critique)(找出缺點)一種抽樣方法。當你看到這類問題時,請留意兩點:

1. 樣本量是否足夠大?

小樣本是「不可靠的」。如果你只問了 2 個人的意見,其中一個人的奇怪觀點就會讓你的結果產生 50% 的誤差!更大的樣本通常更具代表性。

2. 是否存在偏差?

思考數據是在哪裡什麼時候收集的。
例子:如果你想知道人們有多喜歡足球,千萬不要在週六的球場外詢問群眾(這就是有偏差的!)。

你知道嗎?
1936 年,美國一家雜誌根據 240 萬人的樣本,預測 Alf Landon 在總統大選中將以壓倒性優勢獲勝。然而,他們是從電話簿和汽車登記冊中選擇樣本。在 1936 年,只有富有的人才有電話和汽車。這個樣本是有偏差的,結果 Franklin D. Roosevelt 實際上以壓倒性優勢贏得了選舉!

5. 常見錯誤避雷針

混淆樣本與母體:一定要仔細閱讀題目。給出的數字是整個群體還是僅僅是他們測試的一小部分
認為「隨機」等於「隨意」:在數學中,「隨機」有嚴格的定義(相同的機率)。在街角隨便找人問不是隨機的;那是機會抽樣。
忽略背景資訊:如果題目涉及「大型數據集 (Large Data Set)」,請記住,對該數據集進行不同的抽樣可能會顯示出不同的趨勢。

3.12 K 節重點總結

母體 (Population) 是整體;樣本 (Sample) 是局部。
簡單隨機抽樣給予每個人相同的機會(無偏,但需要名單)。
機會抽樣使用當時在場的人(快速,但有偏差)。
• 不同的樣本會導致不同的推論 (Inferences)
• 要批判一個樣本,請檢查是否存在偏差樣本量問題。

繼續練習吧!統計學的精髓就在於理解我們如何信任每天在新聞中看到的那些數字。你能做到的!