統計假設檢定導論

歡迎!如果你曾經好奇科學家是如何判斷一種新藥是否有效,或者廠商如何證明他們的燈泡真的能像宣稱的那樣耐用,那麼你就是在接觸統計假設檢定 (Statistical Hypothesis Testing)。在本章中,我們將學習根據數據進行決策的正式「遊戲規則」。如果剛開始覺得這些概念有點抽象,別擔心;一旦你掌握了相關術語,這就像跟著食譜做菜一樣簡單!

1. 假設檢定的語言

在進行任何計算之前,我們需要先熟悉它的專業術語。你可以把假設檢定想像成一場法庭審訊

關鍵術語

  • 虛無假設 (Null Hypothesis, \(H_0\)): 這代表「在證明有罪前假定無罪」的立場。我們假設一切正常或與先前宣稱的一致。例如:「這枚硬幣是公平的」(\(p = 0.5\))。
  • 對立假設 (Alternative Hypothesis, \(H_1\)): 這就是你試圖證明的內容。例如:「這枚硬幣有偏差」(\(p \neq 0.5\))。
  • 檢定統計量 (Test Statistic): 我們所收集的實際證據(例如:投擲 20 次硬幣中出現正面次數的結果)。
  • 顯著水準 (Significance Level, \(\alpha\)): 判斷的「門檻」。通常設定為 5% (0.05) 或 1% (0.01)。這是當虛無假設實際上為真時,我們卻錯誤地拒絕它的機率。
  • 臨界區域 (Critical Region): 導致我們認定為「有罪」(拒絕 \(H_0\))的檢定統計量數值範圍。
  • 臨界值 (Critical Value): 劃定臨界區域邊界的數值。
  • p 值 (p-value): 在假設 \(H_0\) 為真的前提下,獲得目前結果(或更極端結果)的機率。

單尾檢定 vs. 雙尾檢定

如何知道該用哪一種?觀察題目中的字眼就知道了!

  • 單尾檢定 (1-tail test): 當宣稱涉及特定方向時使用。
    例子:「這種新肥料是否更好?」(\(H_1: p > 0.5\)) 或「機器是否裝填不足?」(\(H_1: p < 0.5\))。
  • 雙尾檢定 (2-tail test): 當宣稱內容僅表示某事物已經改變有所不同時使用。
    例子:「這枚硬幣是否有偏差?」(\(H_1: p \neq 0.5\))。

快速複習: 在 5% 顯著水準的雙尾檢定中,你需要將顯著水準平分為兩端,即底端佔 2.5%,頂端佔 2.5%。

重點提示: 務必以母體參數(如 \(p\) 或 \(\mu\))清楚定義你的假設。

2. 比例檢定(二項分佈)

當我們在固定次數的試驗中計算「成功」次數時,會使用此方法。

步驟流程

  1. 列出你的假設: 使用 \(p\) 作為母體比例。\(H_0: p = \dots\) 以及 \(H_1: p \dots\)
  2. 識別分佈: 假設 \(H_0\) 為真,則 \(X \sim B(n, p)\)。
  3. 計算 p 值: 使用計算機找出你的結果或更極端結果的機率。
    • 若檢定大於:\(P(X \geq \text{observed})\)
    • 若檢定小於:\(P(X \leq \text{observed})\)
  4. 比較: 如果你的 p 值小於顯著水準,則拒絕 \(H_0\)。
  5. 在語境中下結論: 務必寫出類似「在 5% 的顯著水準下,有足夠的證據顯示……」的句子。

例子:一位烘焙師宣稱他烤的蛋糕有 90% 會發起。你買了 20 個,只有 15 個發起。他在誇大其詞嗎?
\(H_0: p = 0.9\)
\(H_1: p < 0.9\)
我們使用 \(B(20, 0.9)\) 來檢定 \(P(X \leq 15)\)。如果該機率非常小(小於我們的顯著水準),我們就可以戳破他的謊言!

常見錯誤: 學生常忘記在機率中包含「等於」的部分(例如計算 \(P(X < 15)\) 而非 \(P(X \leq 15)\))。請務必包含觀察值!

3. 相關性檢定 (PMCC)

這用於檢定母體中兩個變數之間是否存在線性關係。

參數說明

  • \(r\): 樣本相關係數(你從數據中計算出來的)。
  • \(\rho\) (rho): 母體相關係數(我們試圖猜測的「真實」關係)。

相關性的假設

  • \(H_0: \rho = 0\)(無線性相關)。
  • \(H_1: \rho > 0\)(正相關)、\(\rho < 0\)(負相關)或 \(\rho \neq 0\)(有相關性)。

你知道嗎? 你不需要計算 \(\rho\)。你只需使用計算機計算 \(r\),然後根據你的樣本大小 (\(n\)) 和顯著水準,與臨界值表(附在公式冊中)進行比較。

重點提示: 如果你計算出的 \(|r|\) 大於臨界值,則代表相關性「足夠強」,足以拒絕無相關性的假設。

4. 平均數檢定(常態分佈)

當我們已知母體變異數,並想根據樣本檢定平均數 (\(\mu\)) 是否已改變時,會使用此方法。

前置知識:樣本平均數的分佈

若母體為 \(X \sim N(\mu, \sigma^2)\),則大小為 \(n\) 的樣本之平均數分佈為: \( \bar{X} \sim N(\mu, \frac{\sigma^2}{n}) \)

記憶小撇步: 當樣本大小 (\(n\)) 變大時,「離散程度」(標準誤)會變小。這很合理,因為大樣本更可靠!

檢定統計量(標準化)

為了找出樣本平均數與宣稱平均數相差了幾個標準差,我們使用: \( Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \)

接著將此 \(Z\) 值與標準常態分佈 \(N(0, 1^2)\) 進行比較。

常態檢定步驟

  1. 列出 \(H_0: \mu = \dots\) 與 \(H_1: \mu \dots\)
  2. 寫下樣本平均數的分佈:\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\)。
  3. 找出 p 值:\(P(\bar{X} > \text{observed mean})\) 或 \(P(\bar{X} < \text{observed mean})\)。
  4. 與顯著水準比較並下結論。

快速複習盒:
對於 5% 的單尾檢定,臨界 Z 值為 1.6449
對於 5% 的雙尾檢定,臨界 Z 值為 \(\pm 1.96\)

最後的鼓勵

假設檢定看起來步驟繁多,但邏輯非常清晰。只要記住:設定假設 \(\rightarrow\) 進行檢定 \(\rightarrow\) 進行比較 \(\rightarrow\) 下結論。 保持書寫規範,並務必將最終答案與題目中的實際情境連結起來。你一定可以的!