Sampling techniques - Mathematics B (MEI) - H630 - Cambridge OCR AS Level

抽樣簡介

歡迎來到統計學的世界！在這章節，我們將探討如何收集數據。試想一下，如果你想知道全英國人最喜歡的披薩配料是什麼，你不可能去詢問所有 6,700 萬人——這不僅會花費無盡的時間，成本更是高得嚇人！因此，我們會選擇一個較小的群體，並根據他們的回答對其他人做出合理的推斷。這正是抽樣 (sampling) 的核心所在。

我們將學習挑選小群體的特定技巧，並確保我們的結果既公平又準確。別擔心，剛接觸這麼多術語可能會覺得有點混亂，我們會逐一為你拆解！

1. 母體與樣本

在選擇抽樣技巧之前，我們需要先了解統計學中兩個主要的「群體」：

母體 (Population)

母體是指你感興趣的整個群體或項目。
例子：北海中所有的鱈魚，或是你學校目前註冊的所有學生。

樣本 (Sample)

樣本是指你實際研究的子集，也就是母體中較小的一部分。
例子：捕獲 100 條鱈魚進行測量，或是訪問食堂裡的 50 名學生。

推論 (Inference)

當我們利用樣本中的數據來描述整個母體時，這過程稱為推論。
重要提示：不同的樣本可能會導致不同的結論！如果你只對學校裡的精英運動員進行抽樣，你可能會「推論」出整間學校的人都非常健康。但如果你只採樣電競社的學生，你可能會得到截然不同的結果。這就是為什麼我們如何選擇樣本顯得如此重要。

快速回顧：
• 母體：「大局」（每個人/每一件事物）。
• 樣本：「小快照」（我們實際檢查的那一部分）。
• 推論：利用快照來猜測整體樣貌。

2. 「黃金標準」：隨機抽樣

為了公平起見，母體中的每個成員都應該有機會被選中。這就引出了簡單隨機抽樣 (Simple Random Sampling, SRS)。

簡單隨機抽樣

在簡單隨機抽樣中，每一個所需規模的可能樣本都有相等的機率被選中。
類比：就像把每個人的名字放進一個巨大的帽子裡，搖勻後抽出 10 個名字。

操作方法：
1. 為母體中的每個成員分配一個唯一的編號（這份名單稱為抽樣框, sampling frame）。
2. 使用亂數產生器（計算機或電腦）來選取號碼。
3. 與這些號碼對應的人員或項目即成為你的樣本。

重點總結：隨機抽樣有助於避免偏誤 (bias)（即偏袒），但你需要一份完整的母體名單才能進行，這在現實中未必總能實現。

3. 其他抽樣技巧

有時候，簡單隨機抽樣並不實用。以下是你在 MEI 課程大綱中需要掌握的其他方法：

系統抽樣 (Systematic Sampling)

這是指你從名單中按固定間隔選擇個體。
例子：選擇每第 10 個走進門的人。
步驟：
1. 計算間隔 \( k = \frac{\text{母體大小}}{\text{樣本大小}} \)。
2. 在 1 和 \( k \) 之間隨機選取一個起點。
3. 不斷加上 \( k \) 來找到後續的參與者。

分層抽樣 (Stratified Sampling)

當母體包含不同特性的群體（稱為層, strata，例如不同的年齡層或性別）且這些群體表現可能不同時使用。樣本需反映母體的比例。
公式： \( \text{從該層抽樣的人數} = \frac{\text{該層人數}}{\text{總母體人數}} \times \text{總樣本大小} \)

配額抽樣 (Quota Sampling)

這與分層抽樣相似，但不是隨機的。訪問員被告知要在特定的類別中找到一定數量的受訪者。
例子：「去找到 20 名 50 歲以上的男性和 20 名女性。」一旦「配額」滿了，他們就停止抽樣。

整群抽樣 (Cluster Sampling)

將母體分成彼此相似的群組（整群）。你隨機選擇幾個整群，然後對裡面的每個人進行採樣。
例子：如果你想對英國的 12 年級學生進行抽樣，你可能會隨機選擇 5 所學校，並訪問這些學校中所有的 12 年級學生。

機會抽樣 (Opportunity/Convenience Sampling)

選擇當時在場且符合條件的人。
例子：在週二早上站在超市門口，詢問前 10 個看到的人。
警告：這通常有很高的偏誤，因為它只包含了當時剛好在那裡的人。

自選抽樣 (Self-Selected Sampling)

參與者自願成為樣本的一部分。
例子：網上投票或「郵寄回覆」的問卷。
你知道嗎？自選樣本往往帶有偏誤，因為觀點強烈的人比不在乎的人更有可能自願參加。

4. 評估抽樣技巧

在考試中，你可能會被要求選擇最佳方法，或解釋為什麼某種方法不好。你應該考慮偏誤 (bias) 和實用性 (practicality)。

常見陷阱（避免這些錯誤！）

• 混淆分層抽樣與配額抽樣：請記住，分層抽樣在組內使用隨機選擇；而配額抽樣使用機會選擇（訪問員先遇到誰就選誰）。
• 混淆整群抽樣與分層抽樣：分層抽樣是從每一層取幾個人；而整群抽樣是從幾個整群取所有人。
• 忽略偏誤：務必檢查抽樣方法是否排除了特定類型的人。例如，如果你在下午 2 點撥打室內電話來調查「工作習慣」，你會錯過所有正在上班的人！

快速回顧總結表

方法：簡單隨機抽樣
優點：完全公平/無偏誤。
缺點：需要完整的母體名單（抽樣框）。

方法：分層抽樣
優點：確保所有群體都被公平地代表。
缺點：組織複雜；需要母體的詳細資料。

方法：機會抽樣
優點：簡單且便宜。
缺點：偏誤機率高。

方法：系統抽樣
優點：將樣本均勻散佈在整份名單中。
缺點：如果名單有隱藏的規律，可能會產生偏誤。

最終重點總結

• 母體是所有人；樣本是其中的一小部分。
• 隨機抽樣給予每個可能的樣本相等的被選中機會。
• 當母體中某些成員比其他人更容易（或更不容易）被包含在內時，就會產生偏誤。
• 選擇抽樣技巧是在統計完美性與現實世界的實用性之間取得平衡。

別擔心，剛開始覺得複雜是正常的——只要你多練習在試題中識別這些方法，區分「配額」與「分層」或「整群」抽樣的差異就會變得更清晰！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。