歡迎來到抽樣技術(Sampling Techniques)的世界!

在本章中,我們將探討數學家和科學家如何在不詢問全球每一位人士的情況下收集數據。試想像一下:你只需要試喝一匙湯,就能判斷整鍋湯是否需要加鹽——你並不需要喝完整鍋湯才能知道答案!我們將會學習挑選這「一匙湯」的正確與錯誤方法,確保我們的結果既公平又準確。

別擔心,初看這些定義可能會覺得很陌生。一旦你了解這些技術在現實生活中如何運作,它們其實非常容易記憶!

1. 基礎概念:總體與樣本 (Population vs. Sample)

在探討如何抽樣之前,我們必須先了解我們所抽取的對象是什麼。

關鍵詞彙

總體 (Population):我們感興趣的整個群體或對象。例子:學校裡所有的學生,或北海裡的每一條鱈魚。
樣本 (Sample):從總體中選出進行研究的較小群體。例子:從學校中抽樣選出的 30 位學生來進行問卷調查。

為什麼要抽樣?

我們使用樣本是因為研究整個總體通常會遇到以下問題:
1. 成本太高。
2. 太耗時。
3. 不可能實現(例如:你無法測試每一個燈泡的壽命,因為這樣測試完後你就沒有燈泡可以賣了!)。

推論:宏觀視野 (Inference)

當我們計算樣本的平均值 (mean)變異數 (variance) 時,我們是在利用這些數據對整個總體進行非正式推論 (informal inference)(即基於數據的合理推測)。
小貼士:不同的樣本會得出不同的結果。如果你選出 5 位學生,他們的平均身高可能與下一組選出的 5 位學生不同。這是很正常的現象!

重點總結

總體就是「整鍋湯」,而樣本就是「那一匙」。我們利用樣本來推斷整鍋湯的味道。

2. 隨機抽樣技術 (Random Sampling Techniques)

隨機樣本 (random sample) 中,總體中的每一項都有被選中的機會。這有助於防止偏誤 (bias)(即不公平或傾向於某種特定結果)。

簡單隨機抽樣 (Simple Random Sampling, SRS)

這是「黃金標準」。任何可能出現的樣本組合都有相等的機會被選中。
做法:為總體中的每個人編號,然後使用亂數產生器來選出樣本。
比喻:把所有人的名字寫在紙條上放入大帽子裡,徹底搖勻後再進行抽取。

系統抽樣 (Systematic Sampling)

這是一種較為「有秩序」的抽樣方式。
做法:
1. 計算你的「間隔」大小 \( k \): \( k = \frac{\text{總體大小}}{\text{樣本大小}} \)
2. 在 1 到 \( k \) 之間隨機選定一個起點。
3. 從該點開始,每隔 \( k \) 個人選取一位。
例子:如果你有 100 人,想要 10 人的樣本,間隔就是 10。你可能從第 3 個人開始,然後選第 13、23、33 個人,以此類推。

分層抽樣 (Stratified Sampling)

當你的總體包含性質可能不同的群體(稱為層 (strata))時使用。例如:十二年級與十三年級的學生。
做法:從每個群體中進行隨機抽樣,但樣本的大小須與該群體在總體中的比例相符。
公式: \( \text{該層的樣本數} = \frac{\text{該層人數}}{\text{總人數}} \times \text{總樣本大小} \)

重點總結

隨機方法通常較為公平,因為它們避免了人為選擇,從而減少了偏誤。

3. 非隨機抽樣技術 (Non-Random Sampling Techniques)

有時候,進行隨機抽樣太困難或太昂貴。在這些情況下,我們必須使用其他方法,但必須非常小心偏誤 (bias)

便利抽樣 (Opportunity Sampling)

這僅僅是挑選當下隨手可得的人。
例子:站在健身房門口,採訪最先走出來的 20 個人。
問題:這非常不公平!這些人可能有相似的興趣(如健身),無法代表整個小鎮的居民。

配額抽樣 (Quota Sampling)

這類似於分層抽樣,但並非隨機
做法:訪問員被要求找出 20 名男性和 20 名女性進行採訪。他們可以隨意挑選任何人,直到達到這些「配額」。
冷知識:街頭民調員經常使用這種方法。一旦他們達到「30 歲以下男性」的配額,他們就會停止詢問這類人,並專門尋找其他群體。

整群抽樣 (Cluster Sampling)

將總體分成多個群體,稱為「群集 (clusters)」(通常基於地理位置)。
做法:隨機選取幾個群集,然後對這些群集內部的每一個人進行採訪。
例子:為了調查英國學校,你可能會隨機抽取 5 個城市,並調查這 5 個城市內的所有學生。

自選抽樣 (Self-Selected / Volunteer Sampling)

人們主動選擇成為樣本的一部分。
例子:新聞網站上的線上「是/否」投票。
問題:通常只有立場鮮明的人才會去回應,因此結果往往呈現極端化!

重點總結

非隨機樣本雖然容易取得,但極有可能出現偏誤,且無法代表總體。

4. 評估抽樣方法

在考試中,你可能會被要求批評某種抽樣方法。以下是評估時的快速檢查清單

1. 是否存在偏誤?
這種方法是否排除了某些群體?(例如:在週二上午 10 點進行調查,會排除大多數朝九晚五的上班族)。
2. 是否具可行性?
你是否有完整的總體清單(即抽樣框, sampling frame)?如果沒有,你就無法進行簡單隨機抽樣!
3. 樣本大小是否足夠?
樣本越小,僅憑偶然得出「古怪」結果的可能性就越高。

避免常見錯誤

錯誤: 認為「隨機」就等於「隨便(haphazard)」。
更正: 在數學中,「隨機」有嚴格定義——必須使用亂數產生器或抽籤系統。在街上「隨意」找人問話實際上是便利抽樣 (Opportunity Sampling)

記憶輔助:抽樣口訣

要記住這些抽樣類型,試試這個口訣:「簡單系統分層,配額便利整群」(對應 Simple, Systematic, Stratified, Quota, Opportunity, Cluster)。

總結:本章重點

1. 總體 (Population) = 整體;樣本 (Sample) = 整體的一部分。
2. 簡單隨機抽樣最公平,但需要完整的總體名單。
3. 分層抽樣確保所有層級都按比例被涵蓋。
4. 系統抽樣使用固定間隔(每第 \( k \) 個項目)。
5. 便利抽樣與自選抽樣雖然常見,但往往有極大的偏誤。
6. 在採信結果之前,務必檢查樣本是否具有代表性 (representative)