歡迎來到抽樣的世界!
在本章中,我們將探討統計學中最實用的部分之一:抽樣 (Sampling)。你有沒有想過電視收視率是如何計算出來的?或者科學家是怎麼知道英國最受歡迎的零食是什麼?他們當然不會去問每一個人!相反,他們會使用一個樣本 (Sample)。
讀完這些筆記後,你將了解如何挑選一組人來代表整個群體(總體)、為什麼保持公平性如此重要,以及如何找出那些導致錯誤結論的瑕疵。
1. 總體 vs. 樣本
要理解抽樣,我們首先需要定義我們處理的兩個主要群體。
什麼是總體 (Population)?
總體是指你想要了解的整個群體。它不一定非要是人——它也可以是工廠生產的所有燈泡,或者是森林裡所有的樹木。
什麼是樣本 (Sample)?
樣本是從總體中挑選出來的一小部分群體。我們透過研究樣本來了解整個總體的情況。
湯的類比:想像你正在煮一大鍋蔬菜湯。
- 總體就是整鍋湯。
- 樣本就是你舀來嚐味道的那一勺湯,用來看看是否需要加鹽。
- 如果那一勺(樣本)味道不錯,你就會假設整鍋湯(總體)的味道也很好!
快速複習:
• 總體:整個群體。
• 樣本:你實際測試的那一部分群體。
2. 為什麼要使用樣本?
你可能會想:「直接問每一個人不是更準確嗎?」雖然沒錯,但通常這是不可能的,原因有三:
1. 時間:訪問一個國家裡的每個人需要花費數年時間。
2. 成本:付錢給調查人員去採訪每一個人太昂貴了。
3. 破壞性測試:如果工廠想測試玻璃瓶在破裂前能承受多大壓力,他們不能測試每一個瓶子,否則就沒東西可以賣了!
重點總結:抽樣是一種更快速且更便宜的方法,能讓你對整個群體的概況有良好的了解。
3. 簡單隨機抽樣 (Simple Random Sampling)
為了確保我們的樣本是公平的,總體中的每一個成員都應該有相等的機會被選中。這稱為簡單隨機抽樣。
如何進行隨機抽樣:
1. 為總體的每一位成員分配一個編號。
2. 使用隨機數生成器(例如計算機或電腦上的功能)來挑選號碼。
3. 被抽中編號的人或物品就成為你的樣本。
記憶小撇步:想想樂透抽獎。機器裡的每一個球都有相同的機會被選中。那就是最完美的隨機樣本!
不用擔心這聽起來很專業! 最主要要記住的是:如果你只是隨便選選坐在你身邊的人,那並不叫「隨機」。這叫「方便抽樣」,一點也不公平。
4. 理解偏差 (Bias)
如果一個樣本無法公平地代表整個總體,它就是有偏差的 (Biased)。偏差會導致誤導性的結果。
偏差的常見原因:
• 地點:如果你想知道英國人對足球的看法,但你只在比賽當天詢問體育館外面的人,你的結果就會有偏差!
• 樣本大小:如果樣本太小(例如只問了 2 個人),它就無法很好地代表整個群體。
• 時間:如果你在週二早上 10 點的超級市場進行調查,你可能無法獲得那些朝九晚五上班族的回饋。
要避免的常見錯誤:許多學生認為「隨機」就是「隨意」。隨手挑選你見到的前 10 個人並非隨機抽樣;這是有偏差的,因為先到場的人和之後才到的人可能具有不同的特徵。
你知道嗎? 1936 年,一本著名的雜誌預測錯了美國總統大選結果,因為他們只對擁有電話和汽車的人進行了民調。當時,只有富人擁有這些東西,所以樣本並不能代表整個總體!
5. 從樣本推斷性質
一旦我們有了樣本數據,我們就可以將其「放大」,用來估算整個總體的性質。這稱為推斷 (Inference)。
放大公式:
要估算總體中的總數,可以使用這個簡單的計算:
\( \text{估算總數} = \frac{\text{樣本中具備該特徵的人數}}{\text{樣本總數}} \times \text{總體大小} \)
步驟範例:
一所學校有 1000 名學生。隨機抽取 50 名學生詢問他們是否喜歡學校午餐。結果有 10 名學生說「喜歡」。試估算全校有多少學生喜歡學校午餐。
步驟 1:找出樣本中表示喜歡的比例:\( \frac{10}{50} = 0.2 \)(即 20%)。
步驟 2:將此比例乘以總人數:\( 0.2 \times 1000 = 200 \)。
答案:我們估算有 200 名學生喜歡學校午餐。
重點總結:樣本越大,你對總體所做的估算就越可靠。
快速總結清單
✓ 總體:你感興趣的整個群體。
✓ 樣本:用來代表該群體的一小部分。
✓ 簡單隨機抽樣:每個人都有相等的機會被選中。
✓ 偏差:當樣本不具代表性(不公平)時。
✓ 推斷:利用樣本結果來預測總體結果。