歡迎來到模擬的世界!
你有沒有想過公司是如何預測隊伍的長度?數學家又是如何在不進行數百萬次實戰的情況下,計算出贏得複雜遊戲的機率?答案就是模擬 (Simulation)。在統計學主修 (Statistics Major) 的這一章中,我們將不再僅僅依靠公式,而是利用科技來「複製」現實生活中的事件。這就像是數學界的飛行模擬器一樣!
模擬是一個強大的工具,因為它讓我們能夠解決那些因為過於「混亂」或技術上過於複雜,而難以用標準理論方程式處理的問題。讓我們開始吧!
1. 什麼是模擬?為什麼要使用它?
模擬的核心是利用模型來模仿現實世界系統隨時間推移的行為。當理論數學變得不可能計算,或者實在太過困難時,我們就會用到它。
類比: 想像你想知道某個紙飛機設計能否飛出 10 米。你可以運用複雜的物理方程式(理論),或者你也可以直接試飛 500 次並記錄結果(模擬)。在本課程中,我們利用試算表 (spreadsheets) 讓我們在瞬間完成這「500 次試飛」!
必須掌握的關鍵術語:
- 試驗 (Trial): 模擬的一次「運行」(就像擲一次硬幣)。
- 相對頻率 (Relative Frequency): 事件在模擬過程中發生的比例。隨著試驗次數增加,這個數值會越來越接近理論機率 (theoretical probability)。
- 變異 (Variation): 指每次運行模擬時,由於隨機性,結果總會略有不同的現象。
快速複習: 模擬不像公式那樣給出「精確」答案;它給出的是一個估計值 (estimate),且試驗次數越多,估計就越精確。
2. 使用試算表模擬分佈 (SZ1)
課程大綱要求你學會如何使用 Excel 或 Google Sheets 等軟體來模擬三種主要的分佈類型。
A. 離散均勻分佈 (Discrete Uniform Distribution)
這適用於一組固定數量的結果,且每個結果發生的機率均等(如公正的骰子)。在試算表中,我們使用:
=RANDBETWEEN(lower, upper)
例子: 若要模擬一顆 6 面骰子,你可以輸入 \( =RANDBETWEEN(1, 6) \)。
B. 連續均勻分佈 (Continuous Uniform Distribution)
這適用於兩個數值之間的隨機數,其中任何小數都有可能出現。通常,我們使用以下指令產生 0 到 1 之間的數字:
=RAND()
你知道嗎? 電腦產生的「隨機性」大多數被稱為偽隨機性 (pseudo-randomness),因為它是透過精妙的演算法生成的,但對於我們的統計作業來說,它已經足夠隨機了!
C. 常態分佈 (Normal Distribution)
模擬常態分佈稍微複雜一些,但在考試中非常常見。我們使用一個公式,將一個隨機機率(0 到 1 之間)轉換為常態曲線上的數值:
=NORM.INV(RAND(), \(\mu\), \(\sigma\))
注意: 有些軟體會要求輸入標準差 \( \sigma \),有些則要求變異數 \( \sigma^2 \)。務必仔細閱讀題目!對於 MEI 課程而言,通常是指標準差。
重點提示: 試算表幾乎所有模擬都以 RAND() 作為引擎。如果你的數字跟朋友的不一樣,別擔心——那正是變異 (variation) 在發揮作用!
3. 使用模擬解決難題 (Z2)
有時「理論」太難了。例如,如果你想找出三個不同分佈之和的機率,數學計算可能會非常複雜,但模擬可以讓它變得簡單。
「火車等待時間」例子
想像你每天通勤上班。火車每 15 分鐘一班。你在隨機時間到達車站。請問你早晚兩班火車的等待時間總和超過 20 分鐘的機率是多少?
理論方法: 這涉及到在二維平面上積分函數。天啊,太複雜了!
模擬方法:
- 設 \( X \) 為早晨等待時間:\( =15 \times RAND() \)
- 設 \( Y \) 為晚間等待時間:\( =15 \times RAND() \)
- 計算總和:\( T = X + Y \)
- 重複此步驟 1,000 列。
- 計算有多少列滿足 \( T > 20 \),然後除以 1,000。
研究中央極限定理 (CLT)
CLT 指出,如果你取足夠大樣本的平均值,該平均值將遵循常態分佈,即使原始數據不是常態分佈。你可以透過以下方式模擬:
- 從均勻分佈 (Uniform distribution) 中產生 10 個隨機數。
- 計算它們的平均值 (average)。
- 重複此步驟 500 次。
- 繪製這 500 個平均值的直方圖。你會看到一個漂亮的鐘形曲線!
4. 解讀試算表輸出
在考試中,你可能不需要親自操作試算表,但你必須學會解讀它。你可能會看到一張數值表或結果摘要。
常見錯誤: 認為 10 次試驗的模擬結果就是機率的「證明」。10 次試驗實在太少了!你需要進行數百次或數千次試驗,才能減少隨機變異 (random variation) 的影響。
考試題目範例:
「針對兩顆骰子點數之和進行 1,000 次試驗的模擬,結果顯示『7』出現了 162 次。請將此與理論機率進行比較。」
回答方式:
1. 點數為 7 的理論機率是 \( \frac{6}{36} = 0.1667 \)。
2. 模擬的相對頻率是 \( \frac{162}{1000} = 0.162 \)。
3. 結論:模擬結果與理論值非常接近,但由於隨機變異,兩者略有差異。
5. 總結與關鍵重點
目標: 在公式過於困難時,估算機率並模擬行為。
工具:
- RAND() 用於連續均勻分佈 \([0, 1]\)。
- RANDBETWEEN() 用於離散均勻分佈。
- NORM.INV() 用於常態分佈。
心態:
- 試驗次數越多 = 估計越精確。
- 模擬是一種近似值 (approximation),而非完美的「真理」。
- 變異 (Variation) 是預期之內的——如果你重新整理試算表,數字應該會改變!
如果這看起來有點抽象,別擔心!請記住:模擬只不過是在電腦上將某件事重複進行數千次,看看會發生什麼。如果你能描述模擬某個場景的步驟,你就已經掌握了這一章最核心的部分!