簡介:利用數據作決策

歡迎來到假設檢定 (Hypothesis Testing) 的世界!你有沒有聽過某些說法,並好奇它是否真的正確?例如,一家朱古力公司聲稱其朱古力棒重量剛好是 50 克,但你懷疑它們可能不足秤。又或者,一位補習老師聲稱他們的新教學法能讓學生分數提高 10 分。

在本章中,我們將學習如何運用數學方法,去判斷這些說法是否有數據支持。這就像擔任法庭上的法官:我們假設某人是「清白」的(現狀),直到我們有足夠的「證據」(數據)去證明並非如此。如果起初覺得這些概念比較抽象也不用擔心——一旦掌握了當中的步驟,你就會豁然開朗!

1. 核心概念:假設檢定的「角色陣容」

要進行檢定,我們需要定義兩個對立的想法:

虛無假設 \( (H_0) \)

你可以把 \( H_0 \) 想成是「現狀」或「平淡」的版本。它假設沒有任何事情發生改變,或者製造商的說法是正確的。
例子:「朱古力棒的平均重量為 50 克。」 (\( H_0: \mu = 50 \))

對立假設 \( (H_1) \)

這是「令人興奮」的版本——也就是你真正想要測試或尋找證據支持的說法。
例子:「平均重量實際上少於 50 克。」 (\( H_1: \mu < 50 \))

顯著性水平 \( (\alpha) \)

這是我們對「證據」的要求門檻。通常設定為 5% (\( 0.05 \)) 或 1% (\( 0.01 \))。它代表了我們願意承擔犯錯的風險程度。如果結果純粹由隨機因素造成的機率低於此水平,我們就會拒絕那個「平淡」的 \( H_0 \)。

重點重溫:
- \( H_0 \):必須使用等號 (\( = \))。
- \( H_1 \):使用 \( < \)、\( > \) 或 \( \neq \)。
- 證據:只有當我們的數據極不可能由隨機因素造成時,我們才會拒絕 \( H_0 \)。

2. 單尾與雙尾檢定

我們如何知道 \( H_1 \) 該用什麼符號?這取決於我們想測試什麼!

單尾檢定 (One-Tailed Test,方向性):我們明確地尋找增加 減少的趨勢。
例子:「新藥物是否增加了反應時間?」(\( H_1: \mu > \text{數值} \)) 或「節食是否減少了體重?」(\( H_1: \mu < \text{數值} \))。

雙尾檢定 (Two-Tailed Test,非方向性):我們只想知道數值是否改變了有差異,而不論它是增加還是減少。
例子:「機器是否仍校準正確,或者平均重量是否不同於 50 克?」(\( H_1: \mu \neq 50 \))。

記憶小撇步:
如果題目出現「增加」、「減少」、「多於」或「少於」 → 單尾
如果題目出現「改變」、「不同」、「有差異」或「說法是否仍然成立」 → 雙尾

3. 檢定統計量與 p-value

為了作出決策,我們需要將樣本數據轉化為一個標準化的分數,稱為檢定統計量 (Test Statistic, \( Z \))。對於 H1 數學,我們集中處理母體平均數 (\( \mu \))。

檢定統計量的公式為:
\( Z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}} \)

其中:
- \( \bar{x} \) 是樣本平均數。
- \( \mu \) 是來自 \( H_0 \) 的母體平均數。
- \( \sigma \) 是母體標準差。
- \( n \) 是樣本大小。

p-value (p 值)

這是你的圖形計算機 (GC) 會給你的「神奇數字」。它代表了如果 \( H_0 \) 是正確的前提下,獲得你現有樣本結果的機率。

黃金法則:
- 若 p-value \( < \alpha \):結果是「顯著」的,拒絕 \( H_0 \)
- 若 p-value \( \geq \alpha \):證據不足,不拒絕 \( H_0 \)

你知道嗎?在現實世界中,許多科學發現只有在 p-value 小於 0.05 時才被承認。這是證明效力的「黃金標準」!

4. 什麼時候可以使用這個檢定?

根據 8865 課程大綱,我們主要在兩種情況下使用 \( Z \)-檢定:

情況 A:母體呈常態分佈且方差已知
如果題目指出母體為「常態分佈」並且給出了母體方差 (\( \sigma^2 \)),你就可以直接進行檢定!

情況 B:大樣本 (中央極限定理)
如果母體呈常態分佈(或我們不知道其分佈),但樣本大小足夠大 (\( n \geq 30 \)),根據中央極限定理 (CLT),我們依然可以將樣本平均數視為常態分佈!

專家提示:如果你不知道母體方差 (\( \sigma^2 \)),你必須使用由樣本計算出的不偏母體方差估計值 (\( s^2 \))

5. 解題步驟指南

如果覺得步驟繁多也不用擔心,每次只要跟隨這 5 個步驟即可:

步驟 1:列出假設
寫出 \( H_0: \mu = \text{數值} \) 和 \( H_1: \mu (<, >, \text{或} \neq) \text{數值} \)。並用文字清楚定義 \( \mu \) 是什麼!

步驟 2:列出顯著性水平
例如:「在 5% 的顯著性水平下進行檢定。」

步驟 3:列出分佈與檢定統計量
確認你使用的是常態分佈還是 CLT (\( n \geq 30 \))。計算你的 \( Z \) 值(或交由 GC 計算)。

步驟 4:找出 p-value (或臨界區域)
使用圖形計算機的「Z-Test」功能,輸入 \( \mu_0 \)、\( \sigma \)、\( \bar{x} \) 和 \( n \)。

步驟 5:作出結論
比較 p-value 與 \( \alpha \)。
「由於 p-value = 0.03 < 0.05,我們拒絕 \( H_0 \)。在 5% 的顯著性水平下,有足夠證據顯示平均重量已經減少。」

6. 臨界區域與臨界值

有時我們不使用 p-value,而是觀察臨界區域 (Critical Region)。這就是圖表上顯示的「拒絕區」。

如果計算出的 \( Z \)-統計量落在臨界區域內,你就拒絕 \( H_0 \)。

以 5% 單尾檢定(右尾)為例:
臨界值 (Critical Value) 是 \( Z = 1.645 \)。如果計算出的 \( Z > 1.645 \),就代表進入了「拒絕區」。

避免常見錯誤:
當進行 5% 顯著性水平的雙尾檢定時,你必須將 5% 分成兩半!你需要尋找尾部的 2.5% (\( 0.025 \))。如果你的 GC 設定正確(選擇 \( \neq \) 選項),它通常會自動處理,但在回答概念性問題時要特別注意!

總結:關鍵要點

1. 假設: \( H_0 \) 是預設情況;\( H_1 \) 是你要測試的對象。
2. 決策規則: 如果 p-value < 顯著性水平,則拒絕 \( H_0 \)。
3. 大樣本: 如果 \( n \geq 30 \),即使母體非常態,我們也能使用 Z-檢定(歸功於 CLT)。
4. 重視情境: 最終答案必須結合題目的實際背景(例如:「植物的平均高度為...」)。
5. 永遠不要說「接受 \( H_0 \)」: 我們只能「拒絕 \( H_0 \)」或「不拒絕 \( H_0 \)」。我們並沒有證明 \( H_0 \) 是 100% 正確的;只是目前沒有足夠的證據去否定它!