Hypothesis tests - Further Mathematics (XFM01) - Pearson Edexcel International AS Level

歡迎來到假設檢定！

你有沒有想過科學家是如何判定一種新藥是否真正有效，或是工廠如何檢查機器填裝麥片盒是否準確？他們用的就是假設檢定 (Hypothesis Testing)。在本章中，我們將從單純的描述數據轉向根據數據作出重大決策。這本質上就像是數學版的法庭審判：我們假設「未經證明有罪前，均視為無罪」。如果一開始覺得有很多生詞，別擔心——一旦你看出了規律，這就會成為統計學 2 (Statistics 2) 中最符合邏輯的部分之一！

1. 母體、普查與樣本

在我們進行任何測試之前，必須先知道數據來自何處。

關鍵詞彙：

母體 (Population)： 我們感興趣的所有項目的總集合（例如：你學校裡的每一位學生）。
普查 (Census)： 當你測量或觀察母體中每一個成員時。
樣本 (Sample)： 從母體中挑選出來的個別成員或項目的選擇。
抽樣單位 (Sampling Unit)： 母體中可以被抽樣的單一個體（例如：一位學生）。
抽樣框 (Sampling Frame)： 所有抽樣單位的完整列表（例如：學校的學生名冊）。

優缺點：

普查：
+ 優點： 100% 準確；能提供真實的代表性。
- 缺點： 極度耗時、昂貴且處理困難。此外，如果測試涉及破壞性（例如測試燈泡壽命！），你就無法使用普查。

樣本：
+ 優點： 快速、經濟且易於管理。
- 缺點： 可能無法完全代表母體；總是有「抽樣誤差 (sampling error)」的可能性。

快速回顧： 想像一鍋湯。普查就是把整鍋湯喝光來確認鹹度。樣本則是舀起一湯匙。抽樣單位就是那一湯匙，而抽樣框就是鍋裡所有食材的食譜清單！

2. 假設檢定的語言

為了進行測試，我們需要設定「審判」的規則。

什麼是統計量？

統計量 (Statistic) 是僅從樣本數據計算出的數值。它不能包含任何未知的參數（例如母體平均數 \(\mu\) 或機率 \(p\)）。
統計量的抽樣分佈 (Sampling Distribution) 是指該統計量在所有可能的固定大小樣本中，所能取得的所有可能值之機率分佈。

假設

每個測試都有兩個相互競爭的聲明：
1. 虛無假設 \(H_0\) (Null Hypothesis)： 「平淡無奇」的假設。我們假設情況沒有改變，或者主張是正確的。（例如：「硬幣是公平的，\(p = 0.5\)」）。
2. 對立假設 \(H_1\) (Alternative Hypothesis)： 我們正在調查的「令人興奮」的主張。只有在反對 \(H_0\) 的證據非常強烈時，我們才會相信它。（例如：「硬幣有偏差，\(p > 0.5\)」）。

檢定統計量與拒絕域

檢定統計量 (Test Statistic) 是我們從樣本中獲得的具體結果（例如：「我拋了 10 次硬幣，出現了 9 次正面」）。
拒絕域 (Critical Region) 是檢定統計量的數值範圍，如果結果落在此範圍內，代表它極不可能偶然發生，因此我們拒絕 \(H_0\)。
顯著水準 (Significance Level)（通常為 5% 或 1%）是判定結果必須多「不可能」發生的「門檻」。如果在 \(H_0\) 成立的情況下，結果發生的機率小於 5%，我們就拒絕 \(H_0\)。

核心觀念： 如果你的樣本結果落在拒絕域內，你就可以對 \(H_0\) 說「再見」，並擁抱 \(H_1\)。

3. 單尾與雙尾檢定

這取決於問題的要求。

單尾檢定 (One-Tailed Test)： 你正在尋找特定方向的改變。
範例： 「成功的機率是否增加了？」
\(H_1: p > \text{數值}\) 或 \(H_1: p < \text{數值}\)。
顯著水準（例如 5%）完全位於分佈的一端。

雙尾檢定 (Two-Tailed Test)： 你正在尋找任何改變，無論是上升還是下降。
範例： 「機率是否改變了？」
\(H_1: p \neq \text{數值}\)。
重要： 你必須將顯著水準一分為二！對於 5% 的測試，你需要尋找最高端 2.5% 以及最低端 2.5% 的極端數值。

常見錯誤： 在雙尾檢定中忘記將顯著水準減半。一定要檢查題目問的是「改變」（雙尾）還是「增加/減少」（單尾）。

4. 二項分佈參數 \(p\) 的檢定

當我們有固定次數的試驗 \(n\)，且要檢定成功機率 \(p\) 時，就會用到這個方法。

步驟流程：

1. 陳述 \(H_0\)（例如 \(H_0: p = 0.4\)）和 \(H_1\)（例如 \(H_1: p > 0.4\)）。
2. 陳述虛無假設下的分佈：\(X \sim B(n, p)\)。
3. 確定顯著水準（例如 5%）。
4. 計算觀察到的結果或更極端結果的機率。對於 \(H_1: p > k\)，計算 \(P(X \geq \text{observed})\)。
5. 結論： 如果機率小於顯著水準，則拒絕 \(H_0\)。否則，不要拒絕 \(H_0\)。

使用常態近似：

如果 \(n\) 很大且 \(p\) 接近 0.5，你可以使用常態分佈來近似二項分佈。只要記住連續修正 (Continuity Correction) 即可！
若 \(X \sim B(n, p)\)，則 \(X \approx N(np, np(1-p))\)。
小撇步： 二項分佈中的 \(P(X \geq 10)\) 變為常態分佈中的 \(P(Y > 9.5)\)。

5.卜瓦松平均數 \(\lambda\) 的檢定

當我們在檢定一段區間內的發生率時，會使用此方法。

範例：

一家店每小時通常有 10 位顧客 (\(\lambda = 10\))。他們投放廣告後想看看速率是否增加。他們計算出某一小時內有 15 位顧客。
\(H_0: \lambda = 10\)
\(H_1: \lambda > 10\)
使用 \(\lambda = 10\) 的卜瓦松分佈表找出 \(P(X \geq 15)\)。如果這個機率非常小（小於你的顯著水準），廣告就有效！

你知道嗎？ 假設檢定並不能「證明」任何事情是 100% 確定的。它只是告訴我們證據是否「強大到足以令人信服」。這就是為什麼我們總是使用諸如「有足夠的證據顯示……」之類的說法。

總結清單

- 定義變數： 明確說明 \(X\) 代表什麼。
- 寫出假設： 使用符號（\(p\) 或 \(\lambda\)）。
- 找出機率： 使用統計表或計算機找出「p 值」（即在 \(H_0\) 成立前提下，出現該結果的機率）。
- 比較： 將 p 值與顯著水準進行比較。
- 情境結論： 務必以題目原本的情境寫出最終答案（例如：「有證據顯示機器故障了」）。

如果一開始覺得很棘手，別擔心！練習寫步驟的次數越多，這就會變得越自然。留意那些「尾端」，並務必仔細閱讀題目！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。