Statistical Sampling - Mathematics A - H230 - Cambridge OCR AS Level

歡迎來到統計抽樣的世界！

你好！歡迎來到數學課程中最實用的一個單元。你有沒有想過新聞頻道是如何在點票結束前預測選舉結果的？或者科學家如何在不對地球上每個人進行測試的情況下，判斷一種新藥是否有效？答案就是抽樣（Sampling）。

在本章中，我們將學習如何挑選一小群人或物件來代表一個龐大的群體。如果比起代數，統計學讓你覺得內容比較「文字化」，別擔心——我們會循序漸進地為你拆解！

1. 基本概念：總體與樣本

在我們開始挑選群體之前，需要先了解「整體」與「我們觀察的部分」之間的區別。

關鍵術語：

總體（Population）：你感興趣的全部人員或物件。
例子：你學校裡的所有學生。

樣本（Sample）：從總體中挑選出來，實際進行研究的一小群人。
例子：午飯時間在食堂隨機挑選的 20 名學生。

普查（Census）：收集總體中每一位成員的數據。
例子：政府每 10 年進行一次的人口普查。

抽樣框（Sampling Frame）：總體中所有人或物件的列表。你需要這份列表來進行隨機抽樣。
例子：學校的學生註冊名冊。

「湯」的類比

想像你正在煮一大鍋蔬菜湯（這是總體）。你想知道湯是否需要多加點鹽。你不會把整鍋湯喝光（那是普查）！相反，你會先攪拌均勻，然後嚐一勺（這是樣本）。如果那一勺湯的鹹度適中，你就可以推論（infer）整鍋湯的味道沒問題。

快速複習箱：
• 總體 = 整鍋湯。
• 樣本 = 那一勺湯。
• 普查 = 把整鍋湯喝完（既昂貴又花時間！）。

核心重點：我們使用樣本是因為它比普查更快捷、成本更低。如果我們的樣本具代表性，我們就可以對整個總體做出「非正式推論」——也就是合理的估計。

2. 你必須掌握的抽樣技巧

OCR 課程大綱要求你理解並能夠使用兩種特定的抽樣方式：簡單隨機抽樣（Simple Random）和機會抽樣（Opportunity）。

A. 簡單隨機抽樣

在簡單隨機抽樣中，總體的每一位成員都有均等的機會被選中。這就像把所有人的名字寫在紙條上放入一個大帽子裡，然後隨機抽出來一樣。

操作步驟：
1. 給總體的每一位成員編上唯一號碼。
2. 使用隨機數產生器（計算機或電腦上的）來抽取號碼。
3. 將這些號碼與列表中的名字進行對照。

優點：非常公平且無偏見。
缺點：你需要完整的總體列表（抽樣框），這並不總是能夠獲得的。

B. 機會抽樣（便利抽樣）

這種方式是指你直接挑選當下隨手可得的人。
例子：站在超級市場門口，詢問頭 10 個經過的人對某事物的看法。

優點：非常簡單、快速且低成本。
缺點：極有可能產生偏見（biased）。如果你站在健身房外面，你的樣本可能比一般人更熱愛運動！

核心重點：簡單隨機抽樣是公平性的「黃金標準」，但機會抽樣在執行上最為容易。

3. 你需要評鑑的抽樣技巧

接下來的這四種方法，你不需要知道如何計算，但你必須了解它們的定義，以便在考試中討論它們的優缺點。

A. 系統抽樣（Systematic Sampling）

以固定的間隔挑選對象。
例子：在名單上挑選每第 \(10^{th}\) 個人。
評鑑：執行簡單，但如果列表本身有規律，可能會導致樣本出現偏見。

B. 分層抽樣（Stratified Sampling）

將總體分成不同的組別（稱為層（strata）），例如按年齡或性別分組。然後從每一組中進行隨機抽樣，使樣本的比例與總體一致。
例子：如果學校裡 60% 是女生，40% 是男生，那麼你的樣本也應該包含 60% 女生和 40% 男生。
評鑑：它是最能代表總體的抽樣方式，但組織過程較為複雜。

C. 配額抽樣（Quota Sampling）

與分層抽樣類似，你有分組，但不是隨機選擇。你只是不斷尋找對象，直到填滿你的「配額」。
例子：「我需要 10 個男性和 10 個女性；我就隨機攔下遇到的前幾個人。」
評鑑：不需要抽樣框，但研究者挑選對象的偏好可能會引入偏見。

D. 整群抽樣（Cluster Sampling）

你將總體分成小組（群體），每個小組都應該代表整體，然後挑選其中一個完整的群體進行研究。
例子：為了研究英國學生，你挑選 3 所特定的學校，並訪問那裡的所有學生。
評鑑：比在全國各地奔波便宜得多，但如果你挑選的群體並不具代表性，結果就會出錯。

你知道嗎？「Strata」一詞在拉丁語中意為「層」。把分層抽樣想像成一層層的蛋糕——你希望切出來的一塊裡每一層都有！

4. 偏見與樣本大小

即使出發點是好的，事情也可能出錯。這就是所謂的偏見（Bias）。

常見錯誤：

1. 樣本太小：如果你只詢問 2 個人的意見，你不可能知道全國的想法。樣本越大，結果通常越可靠。
2. 無回應（Non-response）：你發出了 100 份問卷，但只有持有強烈（通常是負面）觀點的人才回覆。
3. 覆蓋不足（Undercoverage）：你的抽樣框（列表）遺漏了一些人（例如：使用電話簿會遺漏沒有座機電話的人）。

抽樣變異性（Sampling Variability）

重要的是要明白，不同的樣本會導致不同的結論。如果兩名學生同時從同一所學校隨機抽取 20 人，他們的平均身高結果可能會略有不同。這不是錯誤，這只是抽樣的本質！

如果覺得這部分很難，別擔心：在考試中，如果被要求「評鑑」某種抽樣方法，試著找出它為什麼可能無法公平地代表所有人。它是否遺漏了某個群體？它是否只是挑選了「容易」獲取的人？樣本大小是否太小？

核心重點：一個樣本只有在具代表性（representative）時才是「好的」。如果它偏袒某個群體，那就是有偏見（biased）的。

摘要清單

在繼續之前，請確保你能：

• 定義總體、樣本和普查。
• 解釋如何使用隨機數進行簡單隨機抽樣。
• 描述機會抽樣以及它為何可能產生偏見。
• 識別系統抽樣、分層抽樣、配額抽樣和整群抽樣。
• 解釋為什麼較大的樣本量通常更好。

做得好！你剛剛掌握了統計抽樣的基礎知識。準備好進入數據展示的學習了嗎？

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。