Statistical hypothesis testing

統計假設檢定導論

歡迎！如果你曾經好奇科學家是如何判斷一種新藥是否有效，或者廠商如何證明他們的燈泡真的能像宣稱的那樣耐用，那麼你就是在接觸統計假設檢定 (Statistical Hypothesis Testing)。在本章中，我們將學習根據數據進行決策的正式「遊戲規則」。如果剛開始覺得這些概念有點抽象，別擔心；一旦你掌握了相關術語，這就像跟著食譜做菜一樣簡單！

1. 假設檢定的語言

在進行任何計算之前，我們需要先熟悉它的專業術語。你可以把假設檢定想像成一場法庭審訊。

關鍵術語

虛無假設 (Null Hypothesis, \(H_0\))： 這代表「在證明有罪前假定無罪」的立場。我們假設一切正常或與先前宣稱的一致。例如：「這枚硬幣是公平的」(\(p = 0.5\))。
對立假設 (Alternative Hypothesis, \(H_1\))： 這就是你試圖證明的內容。例如：「這枚硬幣有偏差」(\(p \neq 0.5\))。
檢定統計量 (Test Statistic)： 我們所收集的實際證據（例如：投擲 20 次硬幣中出現正面次數的結果）。
顯著水準 (Significance Level, \(\alpha\))： 判斷的「門檻」。通常設定為 5% (0.05) 或 1% (0.01)。這是當虛無假設實際上為真時，我們卻錯誤地拒絕它的機率。
臨界區域 (Critical Region)： 導致我們認定為「有罪」（拒絕 \(H_0\)）的檢定統計量數值範圍。
臨界值 (Critical Value)： 劃定臨界區域邊界的數值。
p 值 (p-value)： 在假設 \(H_0\) 為真的前提下，獲得目前結果（或更極端結果）的機率。

單尾檢定 vs. 雙尾檢定

如何知道該用哪一種？觀察題目中的字眼就知道了！

單尾檢定 (1-tail test)： 當宣稱涉及特定方向時使用。
例子：「這種新肥料是否更好？」(\(H_1: p > 0.5\)) 或「機器是否裝填不足？」(\(H_1: p < 0.5\))。
雙尾檢定 (2-tail test)： 當宣稱內容僅表示某事物已經改變或有所不同時使用。
例子：「這枚硬幣是否有偏差？」(\(H_1: p \neq 0.5\))。

快速複習： 在 5% 顯著水準的雙尾檢定中，你需要將顯著水準平分為兩端，即底端佔 2.5%，頂端佔 2.5%。

重點提示： 務必以母體參數（如 \(p\) 或 \(\mu\)）清楚定義你的假設。

2. 比例檢定（二項分佈）

當我們在固定次數的試驗中計算「成功」次數時，會使用此方法。

步驟流程

列出你的假設： 使用 \(p\) 作為母體比例。\(H_0: p = \dots\) 以及 \(H_1: p \dots\)
識別分佈： 假設 \(H_0\) 為真，則 \(X \sim B(n, p)\)。
計算 p 值： 使用計算機找出你的結果或更極端結果的機率。
- 若檢定大於：\(P(X \geq \text{observed})\)
- 若檢定小於：\(P(X \leq \text{observed})\)
比較： 如果你的 p 值小於顯著水準，則拒絕 \(H_0\)。
在語境中下結論： 務必寫出類似「在 5% 的顯著水準下，有足夠的證據顯示……」的句子。

例子：一位烘焙師宣稱他烤的蛋糕有 90% 會發起。你買了 20 個，只有 15 個發起。他在誇大其詞嗎？
\(H_0: p = 0.9\)
\(H_1: p < 0.9\)
我們使用 \(B(20, 0.9)\) 來檢定 \(P(X \leq 15)\)。如果該機率非常小（小於我們的顯著水準），我們就可以戳破他的謊言！

常見錯誤： 學生常忘記在機率中包含「等於」的部分（例如計算 \(P(X < 15)\) 而非 \(P(X \leq 15)\)）。請務必包含觀察值！

3. 相關性檢定 (PMCC)

這用於檢定母體中兩個變數之間是否存在線性關係。

參數說明

\(r\)： 樣本相關係數（你從數據中計算出來的）。
\(\rho\) (rho)： 母體相關係數（我們試圖猜測的「真實」關係）。

4. 平均數檢定（常態分佈）

當我們已知母體變異數，並想根據樣本檢定平均數 (\(\mu\)) 是否已改變時，會使用此方法。

前置知識：樣本平均數的分佈

若母體為 \(X \sim N(\mu, \sigma^2)\)，則大小為 \(n\) 的樣本之平均數分佈為： \( \bar{X} \sim N(\mu, \frac{\sigma^2}{n}) \)

記憶小撇步： 當樣本大小 (\(n\)) 變大時，「離散程度」（標準誤）會變小。這很合理，因為大樣本更可靠！

檢定統計量（標準化）

為了找出樣本平均數與宣稱平均數相差了幾個標準差，我們使用： \( Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \)

接著將此 \(Z\) 值與標準常態分佈 \(N(0, 1^2)\) 進行比較。

常態檢定步驟

列出 \(H_0: \mu = \dots\) 與 \(H_1: \mu \dots\)
寫下樣本平均數的分佈：\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)。
找出 p 值：\(P(\bar{X} > \text{observed mean})\) 或 \(P(\bar{X} < \text{observed mean})\)。
與顯著水準比較並下結論。

快速複習盒：
對於 5% 的單尾檢定，臨界 Z 值為 1.6449。
對於 5% 的雙尾檢定，臨界 Z 值為 \(\pm 1.96\)。

最後的鼓勵

假設檢定看起來步驟繁多，但邏輯非常清晰。只要記住：設定假設 \(\rightarrow\) 進行檢定 \(\rightarrow\) 進行比較 \(\rightarrow\) 下結論。 保持書寫規範，並務必將最終答案與題目中的實際情境連結起來。你一定可以的！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。