簡介:歡迎來到高等假設檢定!

你好!在之前的學習中,你已經掌握了假設檢定的基礎知識——利用數據來判斷關於母體的聲稱是否合理。這一章,我們將把這些技巧提升到更高層次。我們將探討在結論中犯錯的情況(誤差)、處理不知道母體變異數的情況(使用 t 分佈),以及如何比較兩組不同的數據以判斷它們之間是否存在真實差異。

假設檢定在現實世界中至關重要。無論是測試新藥是否比舊藥有效,還是檢查工廠的機器校準是否正確,這些方法都能幫助我們在無法百分之百確定的情況下,做出科學的決策。讓我們開始吧!


1. 第一型錯誤與第二型錯誤

假設檢定並非完美。由於我們是利用樣本去推斷母體的真相,因此總會有小機率出錯。我們將這些錯誤歸納為兩類。

什麼是第一型錯誤?

第一型錯誤 (Type I Error) 指的是當虛無假設 (\(H_0\)) 實際上為真,但我們卻拒絕了它
你可以將其視為「假警報」。

類比:想像一下,當沒有火災時,煙霧警報器卻響了。原本的「虛無假設」是「一切正常」,但警報器卻拒絕了這個假設,大喊「有火災!」,而事實上並沒有。

關鍵點:犯下第一型錯誤的機率等於檢定的顯著水準 (\(\alpha\))。如果你使用 5% 的顯著水準進行檢定,那麼你就有 5% 的機率犯下第一型錯誤。

什麼是第二型錯誤?

第二型錯誤 (Type II Error) 指的是當虛無假設 (\(H_0\)) 實際上為假,但我們卻無法拒絕它
你可以將其視為「錯失真相」。

類比:想像廚房真的起火了,但煙霧警報器卻毫無反應。它未能拒絕「一切正常」的假設,儘管事實上情況已經很不對勁了!

速查表:
第一型錯誤:當 \(H_0\) 為真時拒絕 \(H_0\)。(假警報)
第二型錯誤:當 \(H_1\) 為真時無法拒絕 \(H_0\)。(錯失偵測)


2. 學生 t 分佈 (Student's t-distribution)

在基礎統計學 (S1) 中,你可能使用常態分佈 (\(Z\)) 來檢定平均值。然而,使用常態分佈的前提是必須知道母體變異數 (\(\sigma^2\))。但在現實生活中,我們很少知道這個數值!

何時使用 t 分佈?

當符合以下條件時,請使用 t 分佈
1. 母體呈常態分佈
2. 母體變異數 (\(\sigma^2\)) 未知
3. 樣本數 (\(n\)) 較小(雖然對於大樣本也適用!)。

自由度 (\(\nu\))

t 分佈的形狀取決於稱為自由度 (degrees of freedom) 的數值,以希臘字母 nu (\(\nu\)) 表示。對於單樣本檢定:
\( \nu = n - 1 \)

為什麼是 \(n-1\)? 想像你有 3 個數字加起來必須等於 10。你可以任意選擇前兩個數字(它們是「自由」的),但第 3 個數字必須是特定數值才能湊成總和 10。因此你只有 2 個「自由度」。

檢定統計量

要計算我們的檢定值 (\(t\)),我們使用以下公式:
\( t = \frac{\bar{x} - \mu}{s / \sqrt{n}} \)
其中:
• \( \bar{x} \) 為樣本平均值。
• \( \mu \) 為來自 \(H_0\) 的母體平均值。
• \( s \) 為標準差的不偏估計量
• \( n \) 為樣本數。

別擔心,這看起來可能有點複雜! 與常態分佈檢定的主要差異在於我們使用 \(s\) 代替 \(\sigma\),並根據正確的自由度在 t 分佈表中查找臨界值。


3. 兩組平均值的差異檢定

有時我們想比較兩組不同的對象。例如:「聽音樂學習的學生是否比在安靜環境中學習的學生分數更高?」

獨立樣本(常態分佈)

如果我們有兩組獨立樣本且已知母體變異數,我們將檢定平均值的差異 (\(\mu_1 - \mu_2\))。

假設設定:
\( H_0: \mu_1 = \mu_2 \) (兩者無差異)
\( H_1: \mu_1 \neq \mu_2 \) (或 \( > \) 或 \( < \))

使用合併變異數估計量 (\(s_p^2\))

如果我們不知道母體變異數,但假設它們相等,我們將兩組樣本的數據合併(Pool),以獲得更佳的變異數估計。

「合併」公式:
\( s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2} \)

一旦得到 \(s_p^2\),t 分佈的檢定統計量為:
\( t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{s_p^2 (\frac{1}{n_1} + \frac{1}{n_2})}} \)
此檢定的自由度為:\( \nu = n_1 + n_2 - 2 \)。

重點總結:當比較兩個變異數未知但假設相等的群體時,請將它們「合併」以找出共用的變異數,然後使用自由度為 \(n_1 + n_2 - 2\) 的 t 分佈進行檢定。


4. 常見錯誤避雷針

1. 混淆 \(z\) 和 \(t\):務必檢查你是否已知母體變異數 (\(\sigma^2\))。如果只有樣本變異數 (\(s^2\)),請務必使用 t 分佈!

2. 自由度錯誤:對於單樣本,自由度是 \(n-1\)。對於雙樣本(合併),自由度是 \(n_1 + n_2 - 2\)。查表前務必再三確認。

3. 顯著水準:仔細閱讀題目,確認是單尾還是雙尾檢定。在雙尾檢定中,你必須將顯著水準平分(例如:5% 在兩端各變為 2.5%)。


總結檢查清單

考試前,請確認你能做到:
• 用文字定義第一型與第二型錯誤,並在情境中辨識它們。
• 說明使用 t 分佈的條件。
• 計算變異數的不偏估計量 \(s^2\)。
• 為雙樣本檢定計算合併變異數 \(s_p^2\)。
• 正確使用 t 分佈表,並根據自由度 (\(\nu\)) 找到臨界值。
• 透過比較檢定統計量與臨界值來得出結論,以問題的背景語境寫出一句結論。

你一定可以的!統計學其實就是用數字來說故事。持續練習這些計算,規律自然就會變得清晰明瞭!