歡迎來到博弈論的世界!
在決策數學 (Decision Mathematics) 2 的這一章中,我們將探討當你與他人處於「衝突」或競爭狀態時,如何做出最佳決策。無論是棋盤遊戲、商業談判,還是兩支體育隊伍的對抗,博弈論 (Game Theory) 都為尋找「最佳」策略提供了一套數學方法。
如果起初覺得有些抽象,不必擔心。我們會將其拆解為簡單的步驟,運用大量的比喻,並精確演示如何處理考試中的各類題目。讓我們開始吧!
1. 基礎:二人零和博弈
在 Edexcel 的課程大綱中,我們專注於二人零和博弈 (Two-person zero-sum games)。
這是什麼意思?
1. 二人 (Two-person): 只有兩名玩家(通常稱為玩家 A 和玩家 B)。
2. 零和 (Zero-sum): 一方的得益即是另一方的損失。如果我贏了 £10,你就輸了 £10。我們得失的「總和」為零:\( +10 + (-10) = 0 \)。
收益矩陣 (Pay-off Matrix)
遊戲的結果會顯示在一張稱為收益矩陣的表格中。
重要規則: 預設情況下,矩陣中的數字代表行玩家(玩家 A)的收益。
例子: 如果表中的值為 5,則玩家 A 贏得 5 分,玩家 B 輸掉 5 分。如果值為 -3,則玩家 A 輸掉 3 分(意味著玩家 B 贏得 3 分)。
重點複習:
- 正數 = 行玩家贏 / 列玩家輸。
- 負數 = 行玩家輸 / 列玩家贏。
關鍵點: 永遠先站在「行玩家」的角度看遊戲。如果你是「列玩家」,你希望矩陣中的數字越小(越負)越好!
2. 保守策略與穩定解
想像你正在與一個非常聰明的對手博弈。你預設他們總會試圖破壞你的計畫。為了保護自己,你會使用保守策略 (Play-safe strategy)。
逐步教學:尋找保守策略
對於玩家 A(行):
1. 查看每一行並找出最小值(該策略下的最壞情況)。
2. 在這些最小值中,選出最大值。這稱為行最大最小策略 (Row Maximin)。
比喻:玩家 A 是在「最大化其最差情況」。
對於玩家 B(列):
1. 查看每一列並找出最大值(玩家 B 可能損失的最大值)。
2. 在這些最大值中,選出最小值。這稱為列最小最大策略 (Column Minimax)。
比喻:玩家 B 是在「最小化其最大損失」。
穩定解(鞍點 Saddle Points)
如果 行最大最小值 = 列最小最大值,那麼該遊戲就有一個穩定解。
它們交匯的值稱為鞍點 (Saddle point)。在一個穩定的遊戲中,任何一方單方面改變策略都無法提升自己的結果。
冷知識: 之所以稱為鞍點,是因為它是某個方向(行)的最小值,同時又是另一個方向(列)的最大值,形狀就像馬鞍一樣!
常見錯誤: 學生常忘記玩家 B 希望矩陣中的數值越小越好。請務必再次檢查你計算列最小最大值時的過程。
關鍵點: 若行最大最小值 = 列最小最大值,則遊戲穩定。如果兩者不相等,則遊戲不穩定,我們需要「混合策略」(請繼續往下看!)。
3. 化簡矩陣:優勢原則 (Dominance)
在求解複雜遊戲前,我們通常可以透過刪除較差的選項來「瘦身」。這就是優勢原則 (Dominance)。
行規則(玩家 A):
如果第 1 行的每個值都小於或等於第 2 行的對應值,則第 1 行被第 2 行支配 (Dominated)。玩家 A 永遠不會選擇第 1 行,因為第 2 行總是更好或相同。刪除第 1 行。
列規則(玩家 B):
如果第 1 列的每個值都大於或等於第 2 列的對應值,則第 1 列被第 2 列支配。記住,玩家 B 希望數值越小越好。因此,第 1 列對玩家 B 來說更糟。刪除第 1 列。
記憶小撇步:
- 行:數值越大越好(保留大的,刪除小的)。
- 列:數值越小越好(保留小的,刪除大的)。
關鍵點: 先檢查有沒有優勢原則!這能將一個複雜的 \( 3 \times 3 \) 矩陣簡化為更易處理的 \( 2 \times 2 \) 矩陣。
4. 最優混合策略:圖解法
如果一個遊戲沒有鞍點,玩家就不應固守單一動作,而應使用混合策略 (Mixed strategy)——即以特定機率執行不同動作(例如:「我有 30% 的機率出剪刀,70% 的機率出布」)。
在考試中,你可能需要使用圖表來解決 \( 2 \times n \) 或 \( n \times 2 \) 的博弈問題。
\( 2 \times n \) 遊戲的步驟:
1. 設玩家 A 以機率 \( p \) 執行策略 1,以 \( (1-p) \) 的機率執行策略 2。
2. 針對玩家 B 的每個選項,寫出預期收益方程。
例子: 若第 1 行為 (2, 6),第 2 行為 (5, 1),則方程為:
- 針對第 1 列: \( V = 2p + 5(1-p) = 5 - 3p \)
- 針對第 2 列: \( V = 6p + 1(1-p) = 1 + 5p \)
3. 在圖表上繪製這些直線,其中 x 軸為 \( p \)(從 0 到 1),y 軸為 \( V \)(預期價值)。
4. 找出所有線條的下邊界 (Lower boundary)。
5. 找出該下邊界的最高點。這就是 \( p \) 的最優值。
6. 解開交匯於該點的兩個方程,即可算出 \( p \) 以及遊戲價值 \( V \)。
為什麼要找「下邊界的最高點」?
因為玩家 A 正在嘗試最大化(最高點)其最小預期收益(下邊界)。這其實就是 Maximin,只不過加上了機率!
關鍵點: 對於 \( 2 \times n \) 遊戲,尋找底部的最高點。對於 \( n \times 2 \) 遊戲(此時繪製的是玩家 B 的機率 \( q \),尋找頂部的最低點)。
5. 最優混合策略:線性規劃
當矩陣過大而無法使用簡單圖表(例如 \( 3 \times 3 \) 且無優勢)時,我們使用線性規劃 (Linear Programming) 和單純形法 (Simplex Algorithm)。
建立問題:
1. 將所有值轉為正數: 如果矩陣中有負數,在每個格子中加上一個常數 \( k \),使所有數值 \( > 0 \)。 (別忘了在最後得出遊戲價值後減回 \( k \)!)。
2. 設玩家 A 的機率為 \( p_1, p_2, p_3 \)。
3. 我們希望最大化價值 \( V \),條件如下:
\( V \le \) (針對第 1 列的預期收益)
\( V \le \) (針對第 2 列的預期收益)
\( V \le \) (針對第 3 列的預期收益)
\( p_1 + p_2 + p_3 = 1 \)
4. 為便於單純形法計算,我們常將所有式子除以 \( V \),並令 \( x_i = \frac{p_i}{V} \)。此時我們的目標變為最小化 \( \frac{1}{V} = x_1 + x_2 + x_3 \)。
如果覺得難也不必擔心: 考試中最常見的題目是要求你建立模型(寫出方程),而非要求完成整個單純形表格,但兩者都要做好準備!
重點複習盒:
- 鞍點: 行最大最小值 = 列最小最大值。
- 優勢原則: 刪除總是較小的行;刪除總是較大的列。
- 圖解法: 用於 \( 2 \times n \) 或 \( n \times 2 \) 遊戲。
- 線性規劃: 用於更大、不穩定的遊戲。
關鍵點: 線性規劃是博弈論中的「重型工具」。它將遊戲視為資源分配問題,以找出策略間的完美平衡。