歡迎來到統計抽樣的世界!

你有沒有想過,新聞頻道在選票還沒全數點算完之前,是怎麼預測選舉結果的?或者,科學家如何在不必測試地球上每一個人的情況下,判定一種新藥是否有效?其中的秘密就是統計抽樣 (Statistical Sampling)

在本章中,我們將學習如何觀察一小組數據來推斷出更龐大的數據資訊。這是你 Paper 2 考試的核心部分,讓我們一起深入探討吧!


1. 母體 vs. 樣本:湯的類比

在我們開始挑選數據之前,我們需要清楚我們討論的對象是誰(或什麼)。你需要掌握兩個重要的術語:

1. 母體 (Population):這是你感興趣的整個群體。如果你正在研究你們學院學生的身高,那麼母體就是該學院的每一位學生

2. 樣本 (Sample):這是母體的子集,也就是你實際收集數據的那一小部分。如果你詢問 50 位學生的身高,這 50 個人就是你的樣本。

湯的類比

想像你在煮一大鍋蔬菜湯。
- 母體就是整鍋湯。
- 樣本就是你為了試味道、看夠不夠鹹而舀起來的那一湯匙。

快速回顧:你不需要喝完整鍋湯(母體)才能知道它的味道。你只需要舀一湯匙(樣本)就足以對整鍋湯做出推論 (Inference)(即合理的猜測)!

關鍵總結:我們使用樣本母體進行非正式推論,因為這通常比研究所有對象更節省成本、更快速且更容易。


2. 抽樣技術

對於 AQA AS Level 考試,你需要特別了解以下兩種挑選「那湯匙湯」的方法:

A. 簡單隨機抽樣 (Simple Random Sampling)

簡單隨機抽樣中,母體的每一位成員都有均等的機會被選中。這就像把每個人的名字寫下來放進一個巨大的帽子裡,然後盲目地抽出來一樣。

操作方法:
1. 給母體的每一位成員一個唯一的編號。
2. 使用隨機數產生器(在你的計算機或電腦上)來選取你需要的號碼。
3. 被選中號碼對應的人員/項目即成為你的樣本。

優點:它完全無偏見 (Unbiased)。沒有人是因為地理位置或人際關係而被選中的。
缺點:你需要一個完整的母體名單(即「抽樣框」),這有時很難取得。

B. 機會抽樣 (Opportunity Sampling)

機會抽樣(有時稱為便利抽樣)正如其名:從當時在場且符合你標準的人群中選取樣本。

例子:在星期二上午 10 點站在超級市場外,詢問前 20 位經過的人對某個當地議題的看法。

優點:非常簡單、快速且低成本。
缺點:它通常帶有偏見 (Biased)。在上面的例子中,你無法獲得那些在上午 10 點正在工作或上學的人的意見!

記憶小撇步:
- 隨機 (Random) = 公平 (Fair)(每個人都有抽獎券)。
- 機會 (Opportunity) = 簡單 (Easy)(隨手抓身邊的人)。


3. 批判你的樣本

在考試中,你可能會被要求「批判」或「評估」一種抽樣方法。這意味著你需要解釋為什麼一個樣本可能是「不好」或「好」的。

抽樣中最大的敵人是偏見 (Bias)。 當你的樣本無法真實代表母體時,偏見就會發生。

例子:如果你想知道英國青少年的平均零用錢,但你只詢問了一間昂貴私立學校的學生,你的結果將會帶有偏見。它無法代表整個國家。

避免常見錯誤:
  • 不要忽略「對象」:如果題目說研究人員詢問了他們的朋友,這屬於機會抽樣,而且很可能帶有偏見。
  • 樣本太小:如果你的樣本量 \( n \) 太小(例如只問了 2 個人),結果就不太可靠。
  • 不同的樣本,不同的結果:要理解,如果兩個人從同一個母體中抽取兩個不同的樣本,他們很可能會得出不同的結論。這稱為抽樣變異 (Sampling variation),這是非常正常的!

關鍵總結:時刻尋找偏見。問問自己:「母體中的每個人都有公平的機會進入這個樣本嗎?」


4. 使用大型數據集 (Large Data Set, LDS)

針對 Paper 2,AQA 要求你熟悉大型數據集(目前基於「家庭食品 (Family Food)」報告)。雖然你不需要背誦數字,但你應該知道:

  • 你可以從這些大型數據集中抽取樣本來調查趨勢(例如不同地區的人購買牛奶的數量)。
  • 使用科技(如電子試算表或計算機)可以更輕鬆地處理這些海量的資訊。

你知道嗎?大型數據集包含了來自數千個家庭的真實數據!這不僅僅是編造出來的數學題;這正是政府實際追蹤人們飲食習慣的方式。


總結清單

如果覺得定義太多,別擔心!只要記住這五點:

1. 母體是整體;樣本是部分。
2. 簡單隨機抽樣給每個人均等機會(使用隨機數產生器!)。
3. 機會抽樣快速簡單,但通常帶有偏見
4. 樣本用於對母體進行推論
5. 從同一個母體中取出的不同樣本會產生不同的結果

成功小貼士:在考試題目中,如果被問到為什麼某種方法不好,請使用「代表性 (Representative)」這個詞。例如:「該樣本對於母體而言不具代表性,因為……」