離散隨機變量簡介
歡迎來到離散隨機變量(Discrete Random Variables)的世界!雖然這個名字聽起來有點深奧,但它其實是你日常生活中無處不在的概念。如果你曾經好奇過一支球隊的「平均」進球數,或是計算過在第三次嘗試時贏得遊戲的機率,那麼你其實已經在運用隨機變量的思維了。
在這一章中,我們將超越基礎的機率概念,探討如何為具有可數(countable)結果的事件建立模型、進行計算及預測。別擔心統計學聽起來會很枯燥——我們會將其拆解成易於消化的內容,並配合大量現實生活中的例子來深入淺出地學習!
1. 一般離散隨機變量
離散隨機變量(DRV)是一個其值取決於隨機事件結果的變量,且這些數值必須是離散的(意即你可以數出它們,例如 0, 1, 2... 不包含小數!)。我們通常使用大寫字母(如 \( X \))來表示變量本身,並使用小寫字母(如 \( x \))來表示它所能取得的特定數值。
機率分佈
機率分佈(probability distribution)僅僅是一種呈現 \( X \) 所有可能取值及其對應發生機率的方式,我們通常以表格形式來表示。
例子:設 \( X \) 為拋擲兩次硬幣時出現正面的次數。
\( X = 0, 1, 2 \)
\( P(X=0) = 0.25 \)
\( P(X=1) = 0.50 \)
\( P(X=2) = 0.25 \)
重要規則:分佈中所有機率的總和必須始終等於 1。符號表示為:\( \sum P(X=x) = 1 \)。如果你的表格相加不等於 1,那就代表哪裡出錯了!
期望值與方差
它們告訴我們數據的「中心」與「離散程度」。
- 期望值 \( E(X) \): 這是長期平均值,我們通常稱之為平均數,記作 \( \mu \)。
公式:\( E(X) = \mu = \sum x P(X=x) \) - 方差 \( Var(X) \): 這衡量了數值偏離平均值的程度。
公式:\( Var(X) = \sigma^2 = \sum x^2 P(X=x) - \mu^2 \)
快速複習:
1. 期望值 =(數值 \(\times\) 其機率)的總和。
2. 方差 =(數值² \(\times\) 機率)的總和,減去(平均數)²。
常見錯誤:在計算方差時,學生常忘記最後要減去 \( \mu^2 \)。記得在最後一步務必進行檢查!
核心要點:機率分佈告訴你「是什麼」以及「多大可能發生」。\( E(X) \) 告訴你平均數,而 \( Var(X) \) 則告訴你數據的穩定性。
2. 線性轉換 (Linear Coding)
有時我們想改變數據——例如將每個分數加倍,或為每個人加上 5 分。這稱為線性轉換,通常表示為 \( Y = aX + b \)。
平均數與方差的變化:
- 平均數: 它受所有因素影響。如果你給每個分數加 5,平均值就會上升 5;如果你將每個分數加倍,平均值也會加倍。
\( E(aX + b) = aE(X) + b \) - 方差: 它僅受乘法影響。加上一個常數並不會改變「離散程度」(數據點之間的距離保持不變)。然而,由於方差是平方運算,倍數 \( a \) 會變成 \( a^2 \)。
\( Var(aX + b) = a^2 Var(X) \)
類比:想像一群朋友排成一列。如果他們都向前跨兩步(加上 \( b \)),平均位置會移動,但他們之間的距離(方差)保持不變。如果他們將與起點的距離都加倍(乘以 \( a \)),他們之間的間距就會擴大許多!
核心要點:加減會改變平均數但不影響方差。乘除則會將平均數乘以 \( a \),將方差乘以 \( a^2 \)。
3. 離散均勻分佈 (Discrete Uniform Distribution)
在離散均勻分佈中,每個結果發生的機率都相等。想像一顆公正的 6 面骰子:每個數字出現的機率都是 \( 1/6 \)。
對於區間 \( [1, n] \),我們使用符號 \( X \sim U(n) \)。
- 機率: \( P(X=x) = \frac{1}{n} \)
- 平均數: \( E(X) = \frac{n+1}{2} \)
- 方差: \( Var(X) = \frac{n^2 - 1}{12} \)
核心要點:當在固定的整數範圍內,每個事件發生的機會均等時,請使用此模型。
4. 二項分佈 (Binomial Distribution)
你可能在 A Level 數學中見過它!我們使用 \( X \sim B(n, p) \),其中 \( n \) 是試驗次數,\( p \) 是成功機率。
進階數學(Further Maths)的新公式:
除了查表之外,你需要知道以下計算平均數與方差的快捷公式:
\( \mu = np \)
\( \sigma^2 = np(1 - p) \)
例子:如果你拋擲硬幣 100 次,預期出現正面的次數為 \( 100 \times 0.5 = 50 \)。
5. 幾何分佈 (Geometric Distribution)
這是個新概念!幾何分佈模擬的是直到第一次成功出現前的試驗次數。想像你正在練習投籃,你會一直投,直到球進了為止,然後停止。
我們使用符號 \( X \sim Geo(p) \)。
必備公式:
- 在第 \( x \) 次嘗試時成功的機率: \( P(X=x) = (1-p)^{x-1}p \)
(這意味著你經歷了 \( x-1 \) 次失敗,隨後緊接著 1 次成功)。 - 需要超過 \( x \) 次嘗試的機率: \( P(X > x) = (1-p)^x \)
(這是一個方便的捷徑!意即你前 \( x \) 次都失敗了)。 - 平均數: \( E(X) = \frac{1}{p} \)
- 方差: \( Var(X) = \frac{1-p}{p^2} \)
你知道嗎?任何幾何分佈的「眾數」(最可能出現的結果)永遠是 1。儘管成功的機率很低,但最可能的情況永遠是在第一次嘗試就成功!
核心要點:當你在「等待第一次成功」時,請使用幾何分佈。
6. 泊松分佈 (Poisson Distribution)
泊松分佈用於模擬在固定時間或空間區間內,某事件發生的次數。例如你在一小時內收到的郵件數量,或是一塊餅乾裡的巧克力豆數量。
我們使用符號 \( X \sim Po(\lambda) \),其中 \( \lambda \) (lambda) 是平均發生率。
泊松模型的條件:
要適用泊松模型,事件必須滿足:
- 獨立性:一個事件的發生不會影響下一個。
- 單一性:兩個事件不會在同一瞬間同時發生。
- 以恆定的平均速率發生。
公式:
\( P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!} \)
特殊性質:
- 平均數與方差: 在泊松分佈中,平均數與方差相等!
\( E(X) = Var(X) = \lambda \) - 泊松變量的相加: 如果你有兩個獨立的泊松變量 \( X \sim Po(\lambda) \) 和 \( Y \sim Po(\mu) \),那麼它們的和也符合泊松分佈:
\( X + Y \sim Po(\lambda + \mu) \)
不用擔心如果公式看起來很嚇人。大多數時候,你只需要利用計算機內置的泊松函數來查找這些機率!
核心要點:尋找「平均速率」或「區間內出現次數」來辨識泊松問題。請記住,平均數 = 方差。
總結複習
離散均勻分佈:每件事發生的機率均等。
二項分佈:固定次數的試驗,尋找成功次數。
幾何分佈:重複試驗直到第一次成功。
泊松分佈:計算特定時間/空間內的事件發生次數。
恭喜你!你已經掌握了離散隨機變量的核心內容。繼續練習那些公式,並且永遠記得檢查機率總和是否為 1!