Statistical distributions - Mathematics 7357 - AQA A Level

歡迎來到統計分佈的世界！

在本章中，我們將探索如何運用數學模型來預測現實生活中事件發生的可能性。無論是拋硬幣出現正面的次數，還是房間內人群的平均身高，統計分佈都能協助我們理解身邊的「隨機性」。

在研讀完這份筆記後，你將能靈活決定使用哪種模型，並像專業人士一樣計算機率。如果一開始看到很多新符號感到困惑，請別擔心——我們會一步一步為你拆解！

1. 基礎概念：離散與連續

在進入具體模型之前，我們必須先釐清處理的是哪種類型的數據。在統計學中，數據通常分為兩大類：

1. 離散數據 (Discrete Data)： 透過計數得到的數值。例如，你有幾個兄弟姊妹，或是比賽中入球的數量。你不可能有 2.5 個兄弟姊妹！
2. 連續數據 (Continuous Data)： 透過測量得到的數值。例如，身高、體重或時間。這些數值在某個區間內可以是任何值（例如 172.53 cm）。

快速複習：
- 需要計數？ 使用離散分佈（例如二項分佈 Binomial Distribution）。
- 需要測量？ 使用連續分佈（例如常態分佈 Normal Distribution）。

2. 二項分佈（離散）

當你進行固定次數的試驗，並尋求「成功」或「失敗」的結果時，就會用到二項分佈。

何時可以使用？「BINS」口訣

要使用二項分佈模型，情況必須滿足以下四個條件：

B – Binary（二元性）： 只有兩種可能的結果（成功或失敗）。
I – Independent（獨立性）： 每次試驗互不影響（例如拋硬幣）。
N – Number（固定次數）： 試驗總次數 (\(n\)) 是固定的。
S – Success（成功率）： 每次試驗中，成功的機率 (\(p\)) 保持不變。

標示法

我們這樣寫： \(X \sim B(n, p)\)

例子：如果你拋一枚均勻硬幣 10 次，\(n=10\)，\(p=0.5\)。我們寫作 \(X \sim B(10, 0.5)\)。

計算機率

要找出剛好出現 \(r\) 次成功的機率，我們使用以下公式：
\(P(X = r) = \binom{n}{r} \times p^r \times (1-p)^{n-r}\)

分步例子：
擲骰子 5 次，剛好擲出兩次「6點」的機率是多少？
1. 找出 \(n\)：共擲 5 次，所以 \(n = 5\)。
2. 找出 \(p\)：擲出 6 點的機率是 \(1/6\)。
3. 找出 \(r\)：我們想要剛好 2 次成功，所以 \(r = 2\)。
4. 代入公式：\(P(X=2) = \binom{5}{2} \times (1/6)^2 \times (5/6)^3\)。

常見錯誤： 忘記所有機率總和必須為 1。如果成功的機率是 \(p\)，那麼失敗的機率永遠是 \(1 - p\)（通常記作 \(q\)）。

重點總結：

二項分佈用於在固定次數的獨立試驗中計算成功次數。

3. 常態分佈（連續）

常態分佈就是著名的「鐘形曲線」。它適用於那些集中在中心平均值附近的數據，例如鞋碼或新生兒體重。

主要特徵

1. 對稱性： 左側是右側的鏡像。
2. 平均值 (\(\mu\))： 這是曲線的最高點。平均值、中位數和眾數全都相同！
3. 標準差 (\(\sigma\))： 這代表鐘形曲線的「分散程度」。較大的 \(\sigma\) 表示鐘形寬而平坦；較小的 \(\sigma\) 表示鐘形高而瘦窄。
4. 反曲點： 出現在距離平均值一個標準差的位置 (\(\mu \pm \sigma\))。這是曲線從「向下彎」轉變為「向外彎」的地方。

標示法

我們這樣寫： \(X \sim N(\mu, \sigma^2)\)

你知道嗎？ 因為它是一條連續曲線，曲線下的面積即代表機率。整條曲線下的總面積永遠剛好等於 1。

使用計算機

在 AQA Paper 3 中，我們會使用計算機的統計功能，而不是直接運算常態分佈公式。
- 使用 NormalCD 來找出兩個數值之間的機率（例如：「一名學生身高在 160cm 至 170cm 之間的機率是多少？」）。
- 使用 Inverse Normal 來反向操作（例如：「如果要進入最高的 5%，一名學生必須有多高？」）。

類比： 把常態分佈想像成一座山丘。大部分人站在山頂（平均值附近）。當你遠離中心，那裡的人數就會越來越少。

重點總結：

常態分佈由其平均值**和變異數**定義，且具備完美的對稱性**。

4. 選擇正確模型 (N3)

在考試中，你常需要解釋為何選擇特定的分佈。

選擇二項分佈，如果：
- 你在計算「獲勝」的次數。
- 試驗次數固定。
- 結果是獨立的。

選擇常態分佈，如果：
- 數據是連續的（測量值）。
- 數據圍繞平均值對稱分佈。
- 數據極少出現遠離平均值的極端離群值。

5. 分佈之間的聯繫

課程要求了解這兩個模型之間的關係。在特定條件下，二項分佈看起來會非常像常態分佈。具體來說，當試驗次數很多** (\(n\)) 且機率 (\(p\)) 接近 0.5 時，二項分佈的長條圖會形成完美的鐘形！

快速複習箱：
- 二項分佈： \(P(X=r)\) 用於尋找一個確切數值的機率。
- 常態分佈： \(P(X=x)\) 永遠為 0！我們只能計算一個區間的機率（例如 \(P(X < 10)\)）。
- 標準差： 衡量分散程度。數值小代表數據穩定，數值大代表數據變異度高。

摘要核對清單

- 我能解釋二項分佈的 BINS 條件嗎？
- 我能運用計算機找出常態分佈的機率嗎？
- 我知道常態曲線下的總面積等於 1 嗎？
- 我能從 \(N(10, 4)\) 中找出平均值和標準差嗎？ （注意：第二個數是 \(\sigma^2\)，所以 \(\sigma = 2\)）。

如果一開始覺得很棘手，不用擔心！掌握分佈最好的方法就是多用計算機練習。只要熟悉了選單操作，數學就會變得簡單得多！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。

歡迎來到統計分佈的世界！

1. 基礎概念：離散與連續

2. 二項分佈（離散）

何時可以使用？「BINS」口訣

標示法

計算機率

重點總結：

3. 常態分佈（連續）

主要特徵

標示法

使用計算機

重點總結：

4. 選擇正確模型 (N3)

5. 分佈之間的聯繫

摘要核對清單

立即實踐所學