歡迎來到統計抽樣的世界!

你好!歡迎來到數學課程中最實用的一個單元。你有沒有想過新聞頻道是如何在點票結束前預測選舉結果的?或者科學家如何在不對地球上每個人進行測試的情況下,判斷一種新藥是否有效?答案就是抽樣(Sampling)

在本章中,我們將學習如何挑選一小群人或物件來代表一個龐大的群體。如果比起代數,統計學讓你覺得內容比較「文字化」,別擔心——我們會循序漸進地為你拆解!


1. 基本概念:總體與樣本

在我們開始挑選群體之前,需要先了解「整體」與「我們觀察的部分」之間的區別。

關鍵術語:

總體(Population):你感興趣的全部人員或物件。
例子:你學校裡的所有學生。

樣本(Sample):從總體中挑選出來,實際進行研究的一小群人。
例子:午飯時間在食堂隨機挑選的 20 名學生。

普查(Census):收集總體中每一位成員的數據。
例子:政府每 10 年進行一次的人口普查。

抽樣框(Sampling Frame):總體中所有人或物件的列表。你需要這份列表來進行隨機抽樣。
例子:學校的學生註冊名冊。

「湯」的類比

想像你正在煮一大鍋蔬菜湯(這是總體)。你想知道湯是否需要多加點鹽。你不會把整鍋湯喝光(那是普查)!相反,你會先攪拌均勻,然後嚐一勺(這是樣本)。如果那一勺湯的鹹度適中,你就可以推論(infer)整鍋湯的味道沒問題。

快速複習箱:
總體 = 整鍋湯。
樣本 = 那一勺湯。
普查 = 把整鍋湯喝完(既昂貴又花時間!)。

核心重點:我們使用樣本是因為它比普查更快捷、成本更低。如果我們的樣本具代表性,我們就可以對整個總體做出「非正式推論」——也就是合理的估計。


2. 你必須掌握的抽樣技巧

OCR 課程大綱要求你理解並能夠使用兩種特定的抽樣方式:簡單隨機抽樣(Simple Random)機會抽樣(Opportunity)

A. 簡單隨機抽樣

簡單隨機抽樣中,總體的每一位成員都有均等的機會被選中。這就像把所有人的名字寫在紙條上放入一個大帽子裡,然後隨機抽出來一樣。

操作步驟:
1. 給總體的每一位成員編上唯一號碼。
2. 使用隨機數產生器(計算機或電腦上的)來抽取號碼。
3. 將這些號碼與列表中的名字進行對照。

優點:非常公平且無偏見。
缺點:你需要完整的總體列表(抽樣框),這並不總是能夠獲得的。

B. 機會抽樣(便利抽樣)

這種方式是指你直接挑選當下隨手可得的人。
例子:站在超級市場門口,詢問頭 10 個經過的人對某事物的看法。

優點:非常簡單、快速且低成本。
缺點:極有可能產生偏見(biased)。如果你站在健身房外面,你的樣本可能比一般人更熱愛運動!

核心重點:簡單隨機抽樣是公平性的「黃金標準」,但機會抽樣在執行上最為容易。


3. 你需要評鑑的抽樣技巧

接下來的這四種方法,你不需要知道如何計算,但你必須了解它們的定義,以便在考試中討論它們的優缺點。

A. 系統抽樣(Systematic Sampling)

以固定的間隔挑選對象。
例子:在名單上挑選每第 \(10^{th}\) 個人。
評鑑:執行簡單,但如果列表本身有規律,可能會導致樣本出現偏見。

B. 分層抽樣(Stratified Sampling)

將總體分成不同的組別(稱為層(strata)),例如按年齡或性別分組。然後從每一組中進行隨機抽樣,使樣本的比例與總體一致。
例子:如果學校裡 60% 是女生,40% 是男生,那麼你的樣本也應該包含 60% 女生和 40% 男生。
評鑑:它是最能代表總體的抽樣方式,但組織過程較為複雜。

C. 配額抽樣(Quota Sampling)

與分層抽樣類似,你有分組,但不是隨機選擇。你只是不斷尋找對象,直到填滿你的「配額」。
例子:「我需要 10 個男性和 10 個女性;我就隨機攔下遇到的前幾個人。」
評鑑:不需要抽樣框,但研究者挑選對象的偏好可能會引入偏見。

D. 整群抽樣(Cluster Sampling)

你將總體分成小組(群體),每個小組都應該代表整體,然後挑選其中一個完整的群體進行研究。
例子:為了研究英國學生,你挑選 3 所特定的學校,並訪問那裡的所有學生。
評鑑:比在全國各地奔波便宜得多,但如果你挑選的群體並不具代表性,結果就會出錯。

你知道嗎?「Strata」一詞在拉丁語中意為「層」。把分層抽樣想像成一層層的蛋糕——你希望切出來的一塊裡每一層都有!


4. 偏見與樣本大小

即使出發點是好的,事情也可能出錯。這就是所謂的偏見(Bias)

常見錯誤:

1. 樣本太小:如果你只詢問 2 個人的意見,你不可能知道全國的想法。樣本越大,結果通常越可靠。
2. 無回應(Non-response):你發出了 100 份問卷,但只有持有強烈(通常是負面)觀點的人才回覆。
3. 覆蓋不足(Undercoverage):你的抽樣框(列表)遺漏了一些人(例如:使用電話簿會遺漏沒有座機電話的人)。

抽樣變異性(Sampling Variability)

重要的是要明白,不同的樣本會導致不同的結論。如果兩名學生同時從同一所學校隨機抽取 20 人,他們的平均身高結果可能會略有不同。這不是錯誤,這只是抽樣的本質!

如果覺得這部分很難,別擔心:在考試中,如果被要求「評鑑」某種抽樣方法,試著找出它為什麼可能無法公平地代表所有人。它是否遺漏了某個群體?它是否只是挑選了「容易」獲取的人?樣本大小是否太小?

核心重點:一個樣本只有在具代表性(representative)時才是「好的」。如果它偏袒某個群體,那就是有偏見(biased)的。


摘要清單

在繼續之前,請確保你能:

• 定義總體樣本普查
• 解釋如何使用隨機數進行簡單隨機抽樣
• 描述機會抽樣以及它為何可能產生偏見。
• 識別系統抽樣分層抽樣配額抽樣整群抽樣
• 解釋為什麼較大的樣本量通常更好。

做得好!你剛剛掌握了統計抽樣的基礎知識。準備好進入數據展示的學習了嗎?