Further hypothesis testing - Further Mathematics (9665) - Oxford AQA International AS Level

簡介：歡迎來到高等假設檢定！

你好！在之前的學習中，你已經掌握了假設檢定的基礎知識——利用數據來判斷關於母體的聲稱是否合理。這一章，我們將把這些技巧提升到更高層次。我們將探討在結論中犯錯的情況（誤差）、處理不知道母體變異數的情況（使用 t 分佈），以及如何比較兩組不同的數據以判斷它們之間是否存在真實差異。

假設檢定在現實世界中至關重要。無論是測試新藥是否比舊藥有效，還是檢查工廠的機器校準是否正確，這些方法都能幫助我們在無法百分之百確定的情況下，做出科學的決策。讓我們開始吧！

1. 第一型錯誤與第二型錯誤

假設檢定並非完美。由於我們是利用樣本去推斷母體的真相，因此總會有小機率出錯。我們將這些錯誤歸納為兩類。

什麼是第一型錯誤？

第一型錯誤 (Type I Error) 指的是當虛無假設 (\(H_0\)) 實際上為真，但我們卻拒絕了它。
你可以將其視為「假警報」。

類比：想像一下，當沒有火災時，煙霧警報器卻響了。原本的「虛無假設」是「一切正常」，但警報器卻拒絕了這個假設，大喊「有火災！」，而事實上並沒有。

關鍵點：犯下第一型錯誤的機率等於檢定的顯著水準 (\(\alpha\))。如果你使用 5% 的顯著水準進行檢定，那麼你就有 5% 的機率犯下第一型錯誤。

什麼是第二型錯誤？

第二型錯誤 (Type II Error) 指的是當虛無假設 (\(H_0\)) 實際上為假，但我們卻無法拒絕它。
你可以將其視為「錯失真相」。

類比：想像廚房真的起火了，但煙霧警報器卻毫無反應。它未能拒絕「一切正常」的假設，儘管事實上情況已經很不對勁了！

速查表：
• 第一型錯誤：當 \(H_0\) 為真時拒絕 \(H_0\)。(假警報)
• 第二型錯誤：當 \(H_1\) 為真時無法拒絕 \(H_0\)。(錯失偵測)

2. 學生 t 分佈 (Student's t-distribution)

在基礎統計學 (S1) 中，你可能使用常態分佈 (\(Z\)) 來檢定平均值。然而，使用常態分佈的前提是必須知道母體變異數 (\(\sigma^2\))。但在現實生活中，我們很少知道這個數值！

何時使用 t 分佈？

當符合以下條件時，請使用 t 分佈：
1. 母體呈常態分佈。
2. 母體變異數 (\(\sigma^2\)) 未知。
3. 樣本數 (\(n\)) 較小（雖然對於大樣本也適用！）。

自由度 (\(\nu\))

t 分佈的形狀取決於稱為自由度 (degrees of freedom) 的數值，以希臘字母 nu (\(\nu\)) 表示。對於單樣本檢定：
\( \nu = n - 1 \)

為什麼是 \(n-1\)？ 想像你有 3 個數字加起來必須等於 10。你可以任意選擇前兩個數字（它們是「自由」的），但第 3 個數字必須是特定數值才能湊成總和 10。因此你只有 2 個「自由度」。

檢定統計量

要計算我們的檢定值 (\(t\))，我們使用以下公式：
\( t = \frac{\bar{x} - \mu}{s / \sqrt{n}} \)
其中：
• \( \bar{x} \) 為樣本平均值。
• \( \mu \) 為來自 \(H_0\) 的母體平均值。
• \( s \) 為標準差的不偏估計量。
• \( n \) 為樣本數。

別擔心，這看起來可能有點複雜！ 與常態分佈檢定的主要差異在於我們使用 \(s\) 代替 \(\sigma\)，並根據正確的自由度在 t 分佈表中查找臨界值。

3. 兩組平均值的差異檢定

有時我們想比較兩組不同的對象。例如：「聽音樂學習的學生是否比在安靜環境中學習的學生分數更高？」

獨立樣本（常態分佈）

如果我們有兩組獨立樣本且已知母體變異數，我們將檢定平均值的差異 (\(\mu_1 - \mu_2\))。

假設設定：
\( H_0: \mu_1 = \mu_2 \) (兩者無差異)
\( H_1: \mu_1 \neq \mu_2 \) (或 \( > \) 或 \( < \))

使用合併變異數估計量 (\(s_p^2\))

如果我們不知道母體變異數，但假設它們相等，我們將兩組樣本的數據合併（Pool），以獲得更佳的變異數估計。

「合併」公式：
\( s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2} \)

一旦得到 \(s_p^2\)，t 分佈的檢定統計量為：
\( t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{s_p^2 (\frac{1}{n_1} + \frac{1}{n_2})}} \)
此檢定的自由度為：\( \nu = n_1 + n_2 - 2 \)。

重點總結：當比較兩個變異數未知但假設相等的群體時，請將它們「合併」以找出共用的變異數，然後使用自由度為 \(n_1 + n_2 - 2\) 的 t 分佈進行檢定。

4. 常見錯誤避雷針

1. 混淆 \(z\) 和 \(t\)：務必檢查你是否已知母體變異數 (\(\sigma^2\))。如果只有樣本變異數 (\(s^2\))，請務必使用 t 分佈！

2. 自由度錯誤：對於單樣本，自由度是 \(n-1\)。對於雙樣本（合併），自由度是 \(n_1 + n_2 - 2\)。查表前務必再三確認。

3. 顯著水準：仔細閱讀題目，確認是單尾還是雙尾檢定。在雙尾檢定中，你必須將顯著水準平分（例如：5% 在兩端各變為 2.5%）。

總結檢查清單

考試前，請確認你能做到：
• 用文字定義第一型與第二型錯誤，並在情境中辨識它們。
• 說明使用 t 分佈的條件。
• 計算變異數的不偏估計量 \(s^2\)。
• 為雙樣本檢定計算合併變異數 \(s_p^2\)。
• 正確使用 t 分佈表，並根據自由度 (\(\nu\)) 找到臨界值。
• 透過比較檢定統計量與臨界值來得出結論，並以問題的背景語境寫出一句結論。

你一定可以的！統計學其實就是用數字來說故事。持續練習這些計算，規律自然就會變得清晰明瞭！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。