Statistical hypothesis testing - Mathematics 7356 - AQA AS Level

歡迎來到統計假設檢定！

你有沒有試過說：「我敢賭我拋這枚硬幣，出現正面的次數會超過一半」，或者「我覺得這種新藥比舊藥更有效」？在統計學中，我們不只是隨便猜測；我們使用假設檢定 (Hypothesis Testing) 來看看數據是否真的支持我們的說法。如果剛開始覺得這有點抽象，別擔心——把它想像成你是個數學偵探。你正在檢視證據（數據），看看是否真的發生了「犯罪」（某種改變）！

1. 假設檢定的術語

在開始計算之前，我們需要學習一下「行話」。統計檢定有一套專門的術語，你必須正確使用它們才能拿到滿分。

兩個假設

每個檢定都始於兩個相對的陳述：

1. 虛無假設 (Null Hypothesis, \(H_0\))： 這是「現狀」。它假設沒有任何事情改變，一切都很正常。對於二項分佈，我們將其寫為 \(H_0: p = \text{某個數值}\)。
2. 對立假設 (Alternative Hypothesis, \(H_1\))： 這是我們正在調查的主張。它是「等等，我覺得有東西真的不一樣了！」的陳述。我們將其寫為 \(H_1: p < \dots\)、\(H_1: p > \dots\) 或 \(H_1: p \neq \dots\)。

比喻：法庭
想像一場審判。虛無假設是被告「無罪」。我們假設他們是無罪的，除非我們找到了「排除合理懷疑」的證據來證明對立假設（他們是「有罪」的）。

必須知道的重要術語

檢定統計量 (Test Statistic)： 這是你從實驗中得到的實際結果（例如：「我拋了 10 次硬幣，出現了 8 次正面」）。
顯著性水平 (Significance Level, \(\alpha\))： 這是證據必須跨越的「門檻」。常見的水平是 5% (0.05) 或 1% (0.01)。如果我們的結果發生機率小於這個門檻，我們就拒絕 \(H_0\)。
p值 (p-value)： 在虛無假設為真的情況下，獲得該結果（或比該結果更極端的情況）的實際機率。
臨界值 (Critical Value)： 落在拒絕域 (Critical Region) 內的第一個數值。
拒絕域 (Critical Region)： 一組數值範圍，如果結果落入其中，代表證據強烈到足以讓我們決定拒絕虛無假設。

快速回顧：
- \(H_0\) 永遠是 "="。
- \(H_1\) 是 "<"、">" 或 "\(\neq\)"。
- 檢定統計量只是你觀察到的成功次數。

2. 單尾檢定 vs. 雙尾檢定

我們怎麼知道要往哪個方向看？這取決於題目的措辭！

單尾檢定 (1-Tail Test)

當我們尋找單一特定方向的變化時，使用單尾檢定。
例子：「檢定破損雞蛋的比例是否減少了。」
\(H_1: p < 0.05\)

雙尾檢定 (2-Tail Test)

當我們尋找任何變化（不論方向）時，使用雙尾檢定。
例子：「檢定投選 A 黨的人數比例是否改變了。」
\(H_1: p \neq 0.4\)

記憶小撇步：
如果題目說「增加」或「減少」，用單尾；如果題目說「改變」或「不同」，用雙尾！

3. 進行檢定：分步指南

讓我們來看看如何使用二項分佈 (Binomial Distribution) \(X \sim B(n, p)\) 實際進行檢定。

第 1 步：列出假設
務必先定義 \(p\)（例如：「設 \(p\) 為種子發芽的機率」）。然後寫出 \(H_0\) 和 \(H_1\)。

第 2 步：列出顯著性水平
通常題目會給出（例如：5%）。

第 3 步：列出分佈
在虛無假設下，分佈是什麼？例如：\(X \sim B(20, 0.4)\)。

第 4 步：計算 p 值
使用你的計算機找出獲得該結果或更極端結果的機率。
- 若 \(H_1: p > \dots\)，計算 \(P(X \geq \text{觀察值})\)。
- 若 \(H_1: p < \dots\)，計算 \(P(X \leq \text{觀察值})\)。

第 5 步：比較並得出結論
如果你的 p 值小於顯著性水平，你便拒絕 \(H_0\)。表示有「足夠證據」。
如果你的 p 值大於顯著性水平，你便不拒絕 \(H_0\)。表示「證據不足」。

重要提示： 在雙尾檢定中，你必須將你的 p 值與顯著性水平的一半進行比較（例如：若水平為 5%，則將 p 值與兩端的 2.5% 進行比較）。

核心重點：
「若 p 值低，虛無必須走！」（如果 p 值 < 顯著性水平，拒絕 \(H_0\)）。

4. 拒絕域 (Critical Regions)

有時，考官可能不會要求 p 值，而是要求拒絕域。這是一組所有會導致你拒絕虛無假設的可能結果。

例子： 如果你拋 10 次硬幣，拒絕域可能是 \(X=0, 1\) 或 \(X=9, 10\)。如果你的實際結果落在這些「區域」內，你就要拒絕 \(H_0\)。

你知道嗎？
實際顯著性水平是落入拒絕域的真實機率。因為二項分佈是離散的（你不可能有 4.5 次成功），所以實際顯著性水平通常會略低於要求的水平（例如：4.2% 而不是 5%）。

5. 避免常見錯誤

不要掉進這些陷阱！
1. 混淆 \(H_0\) 和 \(H_1\)： 記住，\(H_0\) 永遠是那個包含「等於」的。
2. 忘記背景： 在檢定結束時，你必須寫一句話回歸題目背景。不要只說「拒絕 \(H_0\)」，要說「有足夠證據顯示破損雞蛋的比例已經減少」。
3. 使用錯誤的不等式： 如果你是在檢定「增加」，你需要計算 \(P(X \geq x)\)。學生經常不小心計算成 \(P(X \leq x)\)。
4. 誤解顯著性水平： 要明白顯著性水平是錯誤拒絕虛無假設的機率。換句話說，這是當一切其實只是運氣好時，我們說「情況改變了！」的機率。

總結檢查清單

- 用文字定義參數 \(p\)。
- 寫出 \(H_0\) 和 \(H_1\)。
- 從數據中識別檢定統計量。
- 使用計算機找到 p 值或拒絕域。
- 與顯著性水平進行比較。
- 在題目背景下寫出最終結論。

繼續練習！假設檢定是一個邏輯過程。一旦掌握了這些步驟，你會發現它是 Paper 2 中最容易預測的部分之一！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。