歡迎來到抽樣的世界!

你好!今天我們要深入探討你的 Unit S3: Statistics 3 (統計學 3) 課程中最實用的章節之一:抽樣 (Sampling)。你有沒有想過,電視台是如何計算收視率的?或者科學家如何在不詢問全國每一個人的情況下預測選舉結果?他們運用的就是抽樣!

在本章中,我們將學習如何挑選一小群人(稱為樣本,sample)來準確地代表更龐大的群體(稱為總體,population)。如果統計學現在聽起來有點抽象,別擔心,我們將會運用大量的現實生活例子,讓你輕鬆理解!

1. 基本概念:總體與抽樣框

在我們研究「怎麼做」之前,先來弄清楚「是什麼」。

總體 (Population): 這是你想研究的整個群體。它可能是你學校裡的每一位學生、工廠裡的每一個燈泡,或是世界上的每一個人。

抽樣單位 (Sampling Unit): 這是總體中可以被選中的單個成員。例如,如果你正在研究你的學校,那麼每一位學生就是一個抽樣單位。

抽樣框 (Sampling Frame): 這是總體中所有抽樣單位的清單。你可以把它想像成一本巨大的名冊或電話簿,記錄了所有可能被選中的對象。

你知道嗎? 有時你無法取得抽樣框。例如,如果你想研究海洋裡的魚,你無法列出每一條魚的清單!在這種情況下,某些抽樣方法就無法派上用場。

快速複習:關鍵術語

總體 (Population): 整個群體。
抽樣單位 (Sampling Unit): 群體中的個別成員。
抽樣框 (Sampling Frame): 所有單位的總清單。

2. 簡單隨機抽樣 (Simple Random Sampling, SRS)

這是抽樣中的「黃金標準」。在簡單隨機抽樣中,總體的每一位成員都有相等的機率被選中。

如何操作:
1. 為抽樣框中的每一項分配一個唯一的編號。
2. 使用亂數產生器(例如你的計算機)或亂數表來選取樣本。

類比: 想像把每個人的名字寫在紙條上放入大帽子裡,搖勻後蒙著眼睛抽籤。

優點:
不偏不倚 (Unbiased),因為每個人被選中的機會均等。
• 若總體較小,操作起來非常簡單。

缺點:
必須要有完整的抽樣框(清單)。
• 如果總體分佈在廣大的區域,成本會很高且耗時。

3. 系統抽樣 (Systematic Sampling)

如果你追求效率和節奏,系統抽樣會是你的好幫手。與其為每個人挑選隨機號碼,不如每隔\( k \)個人挑選一個。

操作過程:
1. 計算間隔 \( k \):\( k = \frac{\text{總體大小 (N)}}{\text{樣本大小 (n)}} \)。
2. 在 1 到 \( k \) 之間選擇一個隨機起點。
3. 從該點開始,每隔 \( k \) 個人選擇一個對象。

例子: 你有 100 位學生,想要抽取 20 人的樣本。\( k = 100 / 20 = 5 \)。在 1 到 5 之間選一個隨機數(假設選 3)。那麼你會選出第 3、8、13、18 位學生,以此類推。

優點:
• 非常簡單快捷。
• 樣本均勻地分佈在整個清單中。

缺點:
• 如果清單中存在隱藏的規律(週期性),且剛好與你的間隔 \( k \) 吻合,樣本就會產生偏差。別擔心,這種情況在考題中很少見,但了解一下總沒錯!

4. 分層抽樣 (Stratified Sampling)

有時候,你的總體中包含不同的特徵群體,例如不同的年齡層或性別。為了確保樣本能準確反映這些群體,我們使用分層抽樣

策略:
1. 將總體分成不同的組別,稱為層 (strata)(例如:中五、中六、中七)。
2. 使用以下公式計算每一層應抽取的數量:
\( \text{樣本層人數} = \frac{\text{該層總人數}}{\text{總體總人數}} \times \text{樣本總數} \)
3. 在每一層內部使用簡單隨機抽樣來決定具體人選。

優點:
• 這是最具代表性 (representative) 的方法,因為它確保所有群體都按比例納入。

缺點:
• 你必須事先知道每一層的確切人數。
• 總體必須能明確劃分(不能同時屬於兩個組別!)。

5. 配額抽樣 (Quota Sampling)

這跟前面的方法有點不同,它是非隨機的 (non-random)。市場調查員在街頭進行訪問時經常使用這種方式。

如何運作:
訪問員會收到指令,例如要訪問 20 名男性和 20 名女性。他們會主動找人交談,直到填滿他們的「配額」為止。如果某人拒絕回答,他們就找下一個人。

類比: 就像夜店門口的保安,接到的指令是必須讓 50 個穿藍襯衫和 50 個穿紅襯衫的人進場。

優點:
• 不需要抽樣框(如果沒有名單時非常有用!)。
• 非常便宜且快速。

缺點:
選擇偏差 (Selection bias): 訪問員可能只挑選那些看起來和藹可親或容易交談的對象。
• 因為不是隨機抽樣,你無法準確計算「標準誤差」或運用大部分的統計檢定。

抽樣方法總結

重點摘要表:

簡單隨機: 每個人機會均等。需要清單。
系統抽樣: 每隔 \( k \) 個人取樣。快速且簡單。
分層抽樣: 按比例分組。最具代表性。
配額抽樣: 非隨機。不需要清單。速度快但有偏差。

常見避雷指南

1. 混淆分層抽樣與配額抽樣: 請記住,分層抽樣在分組後是進行隨機選取的,而配額抽樣則取決於訪問員的個人選擇

2. 忘記 \( k \) 的公式: 務必記得是用總體人數除以樣本大小,千萬不要反過來!

3. 抽樣框與總體: 在考試中,如果題目問及簡單隨機抽樣 (SRS) 的缺點,一定要檢查是否真的存在該總體的清單。如果沒有清單,SRS 是根本無法進行的!

繼續加油! 你已經掌握了 S3 抽樣的基礎知識。這些方法是本單元其餘內容的基石。深呼吸一下——你絕對沒問題的!