Hypothesis testing - Mathematics (8865) - GCE A-Level - Higher 1 (H1)

簡介：利用數據作決策

歡迎來到假設檢定 (Hypothesis Testing) 的世界！你有沒有聽過某些說法，並好奇它是否真的正確？例如，一家朱古力公司聲稱其朱古力棒重量剛好是 50 克，但你懷疑它們可能不足秤。又或者，一位補習老師聲稱他們的新教學法能讓學生分數提高 10 分。

在本章中，我們將學習如何運用數學方法，去判斷這些說法是否有數據支持。這就像擔任法庭上的法官：我們假設某人是「清白」的（現狀），直到我們有足夠的「證據」（數據）去證明並非如此。如果起初覺得這些概念比較抽象也不用擔心——一旦掌握了當中的步驟，你就會豁然開朗！

1. 核心概念：假設檢定的「角色陣容」

要進行檢定，我們需要定義兩個對立的想法：

虛無假設 \( (H_0) \)

你可以把 \( H_0 \) 想成是「現狀」或「平淡」的版本。它假設沒有任何事情發生改變，或者製造商的說法是正確的。
例子：「朱古力棒的平均重量為 50 克。」 (\( H_0: \mu = 50 \))

對立假設 \( (H_1) \)

這是「令人興奮」的版本——也就是你真正想要測試或尋找證據支持的說法。
例子：「平均重量實際上少於 50 克。」 (\( H_1: \mu < 50 \))

顯著性水平 \( (\alpha) \)

這是我們對「證據」的要求門檻。通常設定為 5% (\( 0.05 \)) 或 1% (\( 0.01 \))。它代表了我們願意承擔犯錯的風險程度。如果結果純粹由隨機因素造成的機率低於此水平，我們就會拒絕那個「平淡」的 \( H_0 \)。

重點重溫：
- \( H_0 \)：必須使用等號 (\( = \))。
- \( H_1 \)：使用 \( < \)、\( > \) 或 \( \neq \)。
- 證據：只有當我們的數據極不可能由隨機因素造成時，我們才會拒絕 \( H_0 \)。

2. 單尾與雙尾檢定

我們如何知道 \( H_1 \) 該用什麼符號？這取決於我們想測試什麼！

單尾檢定 (One-Tailed Test，方向性)：我們明確地尋找增加或減少的趨勢。
例子：「新藥物是否增加了反應時間？」(\( H_1: \mu > \text{數值} \)) 或「節食是否減少了體重？」(\( H_1: \mu < \text{數值} \))。

雙尾檢定 (Two-Tailed Test，非方向性)：我們只想知道數值是否改變了或有差異，而不論它是增加還是減少。
例子：「機器是否仍校準正確，或者平均重量是否不同於 50 克？」(\( H_1: \mu \neq 50 \))。

記憶小撇步：
如果題目出現「增加」、「減少」、「多於」或「少於」 → 單尾。
如果題目出現「改變」、「不同」、「有差異」或「說法是否仍然成立」 → 雙尾。

3. 檢定統計量與 p-value

為了作出決策，我們需要將樣本數據轉化為一個標準化的分數，稱為檢定統計量 (Test Statistic, \( Z \))。對於 H1 數學，我們集中處理母體平均數 (\( \mu \))。

檢定統計量的公式為：
\( Z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}} \)

其中：
- \( \bar{x} \) 是樣本平均數。
- \( \mu \) 是來自 \( H_0 \) 的母體平均數。
- \( \sigma \) 是母體標準差。
- \( n \) 是樣本大小。

p-value (p 值)

這是你的圖形計算機 (GC) 會給你的「神奇數字」。它代表了如果 \( H_0 \) 是正確的前提下，獲得你現有樣本結果的機率。

黃金法則：
- 若 p-value \( < \alpha \)：結果是「顯著」的，拒絕 \( H_0 \)。
- 若 p-value \( \geq \alpha \)：證據不足，不拒絕 \( H_0 \)。

你知道嗎？在現實世界中，許多科學發現只有在 p-value 小於 0.05 時才被承認。這是證明效力的「黃金標準」！

4. 什麼時候可以使用這個檢定？

根據 8865 課程大綱，我們主要在兩種情況下使用 \( Z \)-檢定：

情況 A：母體呈常態分佈且方差已知
如果題目指出母體為「常態分佈」並且給出了母體方差 (\( \sigma^2 \))，你就可以直接進行檢定！

情況 B：大樣本 (中央極限定理)
如果母體不呈常態分佈（或我們不知道其分佈），但樣本大小足夠大 (\( n \geq 30 \))，根據中央極限定理 (CLT)，我們依然可以將樣本平均數視為常態分佈！

專家提示：如果你不知道母體方差 (\( \sigma^2 \))，你必須使用由樣本計算出的不偏母體方差估計值 (\( s^2 \))。

5. 解題步驟指南

如果覺得步驟繁多也不用擔心，每次只要跟隨這 5 個步驟即可：

步驟 1：列出假設
寫出 \( H_0: \mu = \text{數值} \) 和 \( H_1: \mu (<, >, \text{或} \neq) \text{數值} \)。並用文字清楚定義 \( \mu \) 是什麼！

步驟 2：列出顯著性水平
例如：「在 5% 的顯著性水平下進行檢定。」

步驟 3：列出分佈與檢定統計量
確認你使用的是常態分佈還是 CLT (\( n \geq 30 \))。計算你的 \( Z \) 值（或交由 GC 計算）。

步驟 4：找出 p-value (或臨界區域)
使用圖形計算機的「Z-Test」功能，輸入 \( \mu_0 \)、\( \sigma \)、\( \bar{x} \) 和 \( n \)。

步驟 5：作出結論
比較 p-value 與 \( \alpha \)。
「由於 p-value = 0.03 < 0.05，我們拒絕 \( H_0 \)。在 5% 的顯著性水平下，有足夠證據顯示平均重量已經減少。」

6. 臨界區域與臨界值

有時我們不使用 p-value，而是觀察臨界區域 (Critical Region)。這就是圖表上顯示的「拒絕區」。

如果計算出的 \( Z \)-統計量落在臨界區域內，你就拒絕 \( H_0 \)。

以 5% 單尾檢定（右尾）為例：
臨界值 (Critical Value) 是 \( Z = 1.645 \)。如果計算出的 \( Z > 1.645 \)，就代表進入了「拒絕區」。

避免常見錯誤：
當進行 5% 顯著性水平的雙尾檢定時，你必須將 5% 分成兩半！你需要尋找尾部的 2.5% (\( 0.025 \))。如果你的 GC 設定正確（選擇 \( \neq \) 選項），它通常會自動處理，但在回答概念性問題時要特別注意！

總結：關鍵要點

1. 假設： \( H_0 \) 是預設情況；\( H_1 \) 是你要測試的對象。
2. 決策規則： 如果 p-value < 顯著性水平，則拒絕 \( H_0 \)。
3. 大樣本： 如果 \( n \geq 30 \)，即使母體非常態，我們也能使用 Z-檢定（歸功於 CLT）。
4. 重視情境： 最終答案必須結合題目的實際背景（例如：「植物的平均高度為...」）。
5. 永遠不要說「接受 \( H_0 \)」： 我們只能「拒絕 \( H_0 \)」或「不拒絕 \( H_0 \)」。我們並沒有證明 \( H_0 \) 是 100% 正確的；只是目前沒有足夠的證據去否定它！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。