抽樣簡介

歡迎來到統計學的世界!在這章節,我們將探討如何收集數據。試想一下,如果你想知道全英國人最喜歡的披薩配料是什麼,你不可能去詢問所有 6,700 萬人——這不僅會花費無盡的時間,成本更是高得嚇人!因此,我們會選擇一個較小的群體,並根據他們的回答對其他人做出合理的推斷。這正是抽樣 (sampling) 的核心所在。

我們將學習挑選小群體的特定技巧,並確保我們的結果既公平又準確。別擔心,剛接觸這麼多術語可能會覺得有點混亂,我們會逐一為你拆解!

1. 母體與樣本

在選擇抽樣技巧之前,我們需要先了解統計學中兩個主要的「群體」:

母體 (Population)

母體是指你感興趣的整個群體或項目。
例子:北海中所有的鱈魚,或是你學校目前註冊的所有學生。

樣本 (Sample)

樣本是指你實際研究的子集,也就是母體中較小的一部分。
例子:捕獲 100 條鱈魚進行測量,或是訪問食堂裡的 50 名學生。

推論 (Inference)

當我們利用樣本中的數據來描述整個母體時,這過程稱為推論
重要提示:不同的樣本可能會導致不同的結論!如果你只對學校裡的精英運動員進行抽樣,你可能會「推論」出整間學校的人都非常健康。但如果你只採樣電競社的學生,你可能會得到截然不同的結果。這就是為什麼我們如何選擇樣本顯得如此重要。

快速回顧:
母體:「大局」(每個人/每一件事物)。
樣本:「小快照」(我們實際檢查的那一部分)。
推論:利用快照來猜測整體樣貌。

2. 「黃金標準」:隨機抽樣

為了公平起見,母體中的每個成員都應該有機會被選中。這就引出了簡單隨機抽樣 (Simple Random Sampling, SRS)

簡單隨機抽樣

在簡單隨機抽樣中,每一個所需規模的可能樣本都有相等的機率被選中
類比:就像把每個人的名字放進一個巨大的帽子裡,搖勻後抽出 10 個名字。

操作方法:
1. 為母體中的每個成員分配一個唯一的編號(這份名單稱為抽樣框, sampling frame)。
2. 使用亂數產生器(計算機或電腦)來選取號碼。
3. 與這些號碼對應的人員或項目即成為你的樣本。

重點總結:隨機抽樣有助於避免偏誤 (bias)(即偏袒),但你需要一份完整的母體名單才能進行,這在現實中未必總能實現。

3. 其他抽樣技巧

有時候,簡單隨機抽樣並不實用。以下是你在 MEI 課程大綱中需要掌握的其他方法:

系統抽樣 (Systematic Sampling)

這是指你從名單中按固定間隔選擇個體。
例子:選擇每第 10 個走進門的人。
步驟:
1. 計算間隔 \( k = \frac{\text{母體大小}}{\text{樣本大小}} \)。
2. 在 1 和 \( k \) 之間隨機選取一個起點。
3. 不斷加上 \( k \) 來找到後續的參與者。

分層抽樣 (Stratified Sampling)

當母體包含不同特性的群體(稱為層, strata,例如不同的年齡層或性別)且這些群體表現可能不同時使用。樣本需反映母體的比例
公式: \( \text{從該層抽樣的人數} = \frac{\text{該層人數}}{\text{總母體人數}} \times \text{總樣本大小} \)

配額抽樣 (Quota Sampling)

這與分層抽樣相似,但不是隨機的。訪問員被告知要在特定的類別中找到一定數量的受訪者。
例子:「去找到 20 名 50 歲以上的男性和 20 名女性。」一旦「配額」滿了,他們就停止抽樣。

整群抽樣 (Cluster Sampling)

將母體分成彼此相似的群組(整群)。你隨機選擇幾個整群,然後對裡面的每個人進行採樣。
例子:如果你想對英國的 12 年級學生進行抽樣,你可能會隨機選擇 5 所學校,並訪問這些學校中所有的 12 年級學生。

機會抽樣 (Opportunity/Convenience Sampling)

選擇當時在場且符合條件的人。
例子:在週二早上站在超市門口,詢問前 10 個看到的人。
警告:這通常有很高的偏誤,因為它只包含了當時剛好在那裡的人。

自選抽樣 (Self-Selected Sampling)

參與者自願成為樣本的一部分。
例子:網上投票或「郵寄回覆」的問卷。
你知道嗎?自選樣本往往帶有偏誤,因為觀點強烈的人比不在乎的人更有可能自願參加。

4. 評估抽樣技巧

在考試中,你可能會被要求選擇最佳方法,或解釋為什麼某種方法不好。你應該考慮偏誤 (bias)實用性 (practicality)

常見陷阱(避免這些錯誤!)

混淆分層抽樣與配額抽樣:請記住,分層抽樣在組內使用隨機選擇;而配額抽樣使用機會選擇(訪問員先遇到誰就選誰)。
混淆整群抽樣與分層抽樣:分層抽樣是從每一層取幾個人;而整群抽樣是從幾個整群取所有人
忽略偏誤:務必檢查抽樣方法是否排除了特定類型的人。例如,如果你在下午 2 點撥打室內電話來調查「工作習慣」,你會錯過所有正在上班的人!

快速回顧總結表

方法:簡單隨機抽樣
優點:完全公平/無偏誤。
缺點:需要完整的母體名單(抽樣框)。

方法:分層抽樣
優點:確保所有群體都被公平地代表。
缺點:組織複雜;需要母體的詳細資料。

方法:機會抽樣
優點:簡單且便宜。
缺點:偏誤機率高。

方法:系統抽樣
優點:將樣本均勻散佈在整份名單中。
缺點:如果名單有隱藏的規律,可能會產生偏誤。

最終重點總結

母體是所有人;樣本是其中的一小部分。
隨機抽樣給予每個可能的樣本相等的被選中機會。
• 當母體中某些成員比其他人更容易(或更不容易)被包含在內時,就會產生偏誤
• 選擇抽樣技巧是在統計完美性與現實世界的實用性之間取得平衡。

別擔心,剛開始覺得複雜是正常的——只要你多練習在試題中識別這些方法,區分「配額」與「分層」或「整群」抽樣的差異就會變得更清晰!