歡迎來到統計分佈的世界!
在本章中,我們將探索如何運用數學模型來預測現實生活中事件發生的可能性。無論是拋硬幣出現正面的次數,還是房間內人群的平均身高,統計分佈都能協助我們理解身邊的「隨機性」。
在研讀完這份筆記後,你將能靈活決定使用哪種模型,並像專業人士一樣計算機率。如果一開始看到很多新符號感到困惑,請別擔心——我們會一步一步為你拆解!
1. 基礎概念:離散與連續
在進入具體模型之前,我們必須先釐清處理的是哪種類型的數據。在統計學中,數據通常分為兩大類:
1. 離散數據 (Discrete Data): 透過計數得到的數值。例如,你有幾個兄弟姊妹,或是比賽中入球的數量。你不可能有 2.5 個兄弟姊妹!
2. 連續數據 (Continuous Data): 透過測量得到的數值。例如,身高、體重或時間。這些數值在某個區間內可以是任何值(例如 172.53 cm)。
快速複習:
- 需要計數? 使用離散分佈(例如二項分佈 Binomial Distribution)。
- 需要測量? 使用連續分佈(例如常態分佈 Normal Distribution)。
2. 二項分佈(離散)
當你進行固定次數的試驗,並尋求「成功」或「失敗」的結果時,就會用到二項分佈。
何時可以使用?「BINS」口訣
要使用二項分佈模型,情況必須滿足以下四個條件:
B – Binary(二元性): 只有兩種可能的結果(成功或失敗)。
I – Independent(獨立性): 每次試驗互不影響(例如拋硬幣)。
N – Number(固定次數): 試驗總次數 (\(n\)) 是固定的。
S – Success(成功率): 每次試驗中,成功的機率 (\(p\)) 保持不變。
標示法
我們這樣寫: \(X \sim B(n, p)\)
例子:如果你拋一枚均勻硬幣 10 次,\(n=10\),\(p=0.5\)。我們寫作 \(X \sim B(10, 0.5)\)。
計算機率
要找出剛好出現 \(r\) 次成功的機率,我們使用以下公式:
\(P(X = r) = \binom{n}{r} \times p^r \times (1-p)^{n-r}\)
分步例子:
擲骰子 5 次,剛好擲出兩次「6點」的機率是多少?
1. 找出 \(n\):共擲 5 次,所以 \(n = 5\)。
2. 找出 \(p\):擲出 6 點的機率是 \(1/6\)。
3. 找出 \(r\):我們想要剛好 2 次成功,所以 \(r = 2\)。
4. 代入公式:\(P(X=2) = \binom{5}{2} \times (1/6)^2 \times (5/6)^3\)。
常見錯誤: 忘記所有機率總和必須為 1。如果成功的機率是 \(p\),那麼失敗的機率永遠是 \(1 - p\)(通常記作 \(q\))。
重點總結:
二項分佈用於在固定次數的獨立試驗中計算成功次數。
3. 常態分佈(連續)
常態分佈就是著名的「鐘形曲線」。它適用於那些集中在中心平均值附近的數據,例如鞋碼或新生兒體重。
主要特徵
1. 對稱性: 左側是右側的鏡像。
2. 平均值 (\(\mu\)): 這是曲線的最高點。平均值、中位數和眾數全都相同!
3. 標準差 (\(\sigma\)): 這代表鐘形曲線的「分散程度」。較大的 \(\sigma\) 表示鐘形寬而平坦;較小的 \(\sigma\) 表示鐘形高而瘦窄。
4. 反曲點: 出現在距離平均值一個標準差的位置 (\(\mu \pm \sigma\))。這是曲線從「向下彎」轉變為「向外彎」的地方。
標示法
我們這樣寫: \(X \sim N(\mu, \sigma^2)\)
你知道嗎? 因為它是一條連續曲線,曲線下的面積即代表機率。整條曲線下的總面積永遠剛好等於 1。
使用計算機
在 AQA Paper 3 中,我們會使用計算機的統計功能,而不是直接運算常態分佈公式。
- 使用 NormalCD 來找出兩個數值之間的機率(例如:「一名學生身高在 160cm 至 170cm 之間的機率是多少?」)。
- 使用 Inverse Normal 來反向操作(例如:「如果要進入最高的 5%,一名學生必須有多高?」)。
類比: 把常態分佈想像成一座山丘。大部分人站在山頂(平均值附近)。當你遠離中心,那裡的人數就會越來越少。
重點總結:
常態分佈由其平均值**和變異數**定義,且具備完美的對稱性**。
4. 選擇正確模型 (N3)
在考試中,你常需要解釋為何選擇特定的分佈。
選擇二項分佈,如果:
- 你在計算「獲勝」的次數。
- 試驗次數固定。
- 結果是獨立的。
選擇常態分佈,如果:
- 數據是連續的(測量值)。
- 數據圍繞平均值對稱分佈。
- 數據極少出現遠離平均值的極端離群值。
5. 分佈之間的聯繫
課程要求了解這兩個模型之間的關係。在特定條件下,二項分佈看起來會非常像常態分佈。具體來說,當試驗次數很多** (\(n\)) 且機率 (\(p\)) 接近 0.5 時,二項分佈的長條圖會形成完美的鐘形!
快速複習箱:
- 二項分佈: \(P(X=r)\) 用於尋找一個確切數值的機率。
- 常態分佈: \(P(X=x)\) 永遠為 0!我們只能計算一個區間的機率(例如 \(P(X < 10)\))。
- 標準差: 衡量分散程度。數值小代表數據穩定,數值大代表數據變異度高。
摘要核對清單
- 我能解釋二項分佈的 BINS 條件嗎?
- 我能運用計算機找出常態分佈的機率嗎?
- 我知道常態曲線下的總面積等於 1 嗎?
- 我能從 \(N(10, 4)\) 中找出平均值和標準差嗎? (注意:第二個數是 \(\sigma^2\),所以 \(\sigma = 2\))。
如果一開始覺得很棘手,不用擔心!掌握分佈最好的方法就是多用計算機練習。只要熟悉了選單操作,數學就會變得簡單得多!