歡迎來到效應量 (Effect Size) 的世界!

在學習統計推論 (Statistical Inference) 的過程中,你花了很多時間研究 p值 (p-values) 並決定是否拒絕虛無假設。但你有沒有停下來想過:「即使這個結果在統計上顯著,它在現實世界中真的有意義嗎?」

這正是效應量 (Effect Size) 要告訴你的!顯著性檢定 (p值) 告訴我們結果是否可能由隨機產生,而效應量則告訴我們這個結果實際上有多、有多顯著。如果這聽起來有點抽象,別擔心——我們將會一步步為你拆解。

1. 什麼是效應量?

效應量是一種量化兩組之間差異大小的方法。它是標準顯著性檢定的補充方法。這意味著你應該將兩者結合使用,才能完整解讀數據背後的含義。

日常生活中的類比:
想像你發現了一種「神奇」植物營養劑。假設檢定可能會證明它確實能讓向日葵長得更高(統計顯著性)。然而,效應量會告訴你到底高出多少。如果植物只長高了 1 毫米,那效應量就很微小,即使結果是「顯著」的,這種營養劑可能也不值得花錢買!

要記住的關鍵差異:

  • 顯著性檢定 (p值): 問的是「真的有影響存在嗎?」
  • 效應量: 問的是「影響有多大?」

2. p值、樣本大小與效應量之間的關係

這對你的考試來說非常關鍵。一個常見的錯誤是認為極小的 p值(例如 0.0001)意味著現實世界中有巨大的影響。事實並非總是如此!

假設檢定中的 p值 取決於兩個主要因素:
1. 效應量(實際差異有多大)。
2. 樣本大小(你收集了多少數據)。

「樣本大小陷阱」:
如果你擁有巨大的樣本(數千人),即使是微小、不重要的差異也會變得「統計顯著」。相反地,如果你的樣本非常小,你可能會錯過一個巨大且重要的影響,因為檢定沒有足夠的檢定力 (power) 去「看見」它。

快速複習: 效應量與樣本大小是獨立的。無論你調查了多少人,它都能告訴你變數之間關係的「真實」強度。

3. 衡量效應量:Cohen’s \( d \)

在 Pearson Edexcel 課程中,你需要掌握的主要衡量指標是 Cohen’s \( d \)。當我們比較兩組的平均值 (means) 時,就會用到它。

本質上,Cohen's \( d \) 衡量的是兩組平均值之間相隔了多少個標準差。簡單情況下的公式為:

\( d = \frac{\bar{x}_1 - \bar{x}_2}{s} \)

其中:
- \( \bar{x}_1 \) 和 \( \bar{x}_2 \) 是兩組的平均值
- \( s \) 是標準差(通常是兩組的「合併」標準差)。

解釋邊界

統計學家 Jacob Cohen 在提出這個概念時,建議了一些「經驗法則」來幫助我們理解這些數值的意義。你應該為考試背下這些邊界值

  • \( 0.2 \le d < 0.5 \):小效應量(差異確實存在,但肉眼很難看出來)。
  • \( 0.5 \le d < 0.8 \):中效應量(差異足以被觀察者看見)。
  • \( 0.8 \le d \):大效應量(差異非常明顯且顯著)。

你知道嗎? 0.8 的「大」效應量意味著實驗組的平均人表現比對照組中 79% 的人都好!

4. 環境決定一切!

雖然上述邊界很有用,但課程提醒我們,效應量的解釋取決於具體環境。

例子:
如果一種新的心臟藥物的效應量為 \( d = 0.1 \),按 Cohen 的標準這是「小」的。然而,如果這種藥物每年能拯救 1,000 人的生命,那麼在醫療環境下,這個「小」影響就極其重要!在否定一個小數值之前,一定要先看它衡量的是什麼。

5. 要避免的常見錯誤

  • 錯誤: 認為顯著的 p值 意味著巨大的影響。
    修正: 一定要檢查效應量;顯著性只告訴你結果不太可能是偶然發生的。
  • 錯誤: 將 Cohen's \( d \) 的邊界視為「絕對法律」。
    修正: 將它們作為指導方針,並務必提及問題的背景(例如醫學、教育或體育)。
  • 錯誤: 忘記了即使結果不顯著,也可以計算 \( d \)。
    修正: 效應量是對你手上數據的描述,無論假設檢定的結果如何,都可以計算。

總結檢查清單

- 你能解釋為什麼效應量是假設檢定的「補充」嗎?(它在「是否有影響?」之外,補充了「影響有多大?」)。
- 你知道 Cohen’s \( d \) 的邊界值嗎?(0.2 = 小,0.5 = 中,0.8 = 大)。
- 你理解 p值受樣本大小影響,但效應量不受影響嗎?
- 你能在現實環境中解釋效應量嗎?

如果起初覺得這些很棘手,別擔心!只要記住:顯著性檢定是「是否(Yes/No)」開關,而效應量是「調光器」,它能告訴你燈光到底有多亮。