Game theory - Further Mathematics (9FM0) - Pearson Edexcel A Level

歡迎來到博弈論的世界！

在決策數學 (Decision Mathematics) 2 的這一章中，我們將探討當你與他人處於「衝突」或競爭狀態時，如何做出最佳決策。無論是棋盤遊戲、商業談判，還是兩支體育隊伍的對抗，博弈論 (Game Theory) 都為尋找「最佳」策略提供了一套數學方法。

如果起初覺得有些抽象，不必擔心。我們會將其拆解為簡單的步驟，運用大量的比喻，並精確演示如何處理考試中的各類題目。讓我們開始吧！

1. 基礎：二人零和博弈

在 Edexcel 的課程大綱中，我們專注於二人零和博弈 (Two-person zero-sum games)。
這是什麼意思？
1. 二人 (Two-person)： 只有兩名玩家（通常稱為玩家 A 和玩家 B）。
2. 零和 (Zero-sum)： 一方的得益即是另一方的損失。如果我贏了 £10，你就輸了 £10。我們得失的「總和」為零：\( +10 + (-10) = 0 \)。

收益矩陣 (Pay-off Matrix)

遊戲的結果會顯示在一張稱為收益矩陣的表格中。
重要規則： 預設情況下，矩陣中的數字代表行玩家（玩家 A）的收益。
例子： 如果表中的值為 5，則玩家 A 贏得 5 分，玩家 B 輸掉 5 分。如果值為 -3，則玩家 A 輸掉 3 分（意味著玩家 B 贏得 3 分）。

重點複習：
- 正數 = 行玩家贏 / 列玩家輸。
- 負數 = 行玩家輸 / 列玩家贏。

關鍵點： 永遠先站在「行玩家」的角度看遊戲。如果你是「列玩家」，你希望矩陣中的數字越小（越負）越好！

2. 保守策略與穩定解

想像你正在與一個非常聰明的對手博弈。你預設他們總會試圖破壞你的計畫。為了保護自己，你會使用保守策略 (Play-safe strategy)。

逐步教學：尋找保守策略

對於玩家 A（行）：
1. 查看每一行並找出最小值（該策略下的最壞情況）。
2. 在這些最小值中，選出最大值。這稱為行最大最小策略 (Row Maximin)。
比喻：玩家 A 是在「最大化其最差情況」。

對於玩家 B（列）：
1. 查看每一列並找出最大值（玩家 B 可能損失的最大值）。
2. 在這些最大值中，選出最小值。這稱為列最小最大策略 (Column Minimax)。
比喻：玩家 B 是在「最小化其最大損失」。

穩定解（鞍點 Saddle Points）

如果 行最大最小值 = 列最小最大值，那麼該遊戲就有一個穩定解。
它們交匯的值稱為鞍點 (Saddle point)。在一個穩定的遊戲中，任何一方單方面改變策略都無法提升自己的結果。
冷知識： 之所以稱為鞍點，是因為它是某個方向（行）的最小值，同時又是另一個方向（列）的最大值，形狀就像馬鞍一樣！

常見錯誤： 學生常忘記玩家 B 希望矩陣中的數值越小越好。請務必再次檢查你計算列最小最大值時的過程。

關鍵點： 若行最大最小值 = 列最小最大值，則遊戲穩定。如果兩者不相等，則遊戲不穩定，我們需要「混合策略」（請繼續往下看！）。

3. 化簡矩陣：優勢原則 (Dominance)

在求解複雜遊戲前，我們通常可以透過刪除較差的選項來「瘦身」。這就是優勢原則 (Dominance)。

行規則（玩家 A）：
如果第 1 行的每個值都小於或等於第 2 行的對應值，則第 1 行被第 2 行支配 (Dominated)。玩家 A 永遠不會選擇第 1 行，因為第 2 行總是更好或相同。刪除第 1 行。

列規則（玩家 B）：
如果第 1 列的每個值都大於或等於第 2 列的對應值，則第 1 列被第 2 列支配。記住，玩家 B 希望數值越小越好。因此，第 1 列對玩家 B 來說更糟。刪除第 1 列。

記憶小撇步：
- 行：數值越大越好（保留大的，刪除小的）。
- 列：數值越小越好（保留小的，刪除大的）。

關鍵點： 先檢查有沒有優勢原則！這能將一個複雜的 \( 3 \times 3 \) 矩陣簡化為更易處理的 \( 2 \times 2 \) 矩陣。

4. 最優混合策略：圖解法

如果一個遊戲沒有鞍點，玩家就不應固守單一動作，而應使用混合策略 (Mixed strategy)——即以特定機率執行不同動作（例如：「我有 30% 的機率出剪刀，70% 的機率出布」）。

在考試中，你可能需要使用圖表來解決 \( 2 \times n \) 或 \( n \times 2 \) 的博弈問題。

\( 2 \times n \) 遊戲的步驟：

1. 設玩家 A 以機率 \( p \) 執行策略 1，以 \( (1-p) \) 的機率執行策略 2。
2. 針對玩家 B 的每個選項，寫出預期收益方程。
例子： 若第 1 行為 (2, 6)，第 2 行為 (5, 1)，則方程為：
- 針對第 1 列： \( V = 2p + 5(1-p) = 5 - 3p \)
- 針對第 2 列： \( V = 6p + 1(1-p) = 1 + 5p \)
3. 在圖表上繪製這些直線，其中 x 軸為 \( p \)（從 0 到 1），y 軸為 \( V \)（預期價值）。
4. 找出所有線條的下邊界 (Lower boundary)。
5. 找出該下邊界的最高點。這就是 \( p \) 的最優值。
6. 解開交匯於該點的兩個方程，即可算出 \( p \) 以及遊戲價值 \( V \)。

為什麼要找「下邊界的最高點」？
因為玩家 A 正在嘗試最大化（最高點）其最小預期收益（下邊界）。這其實就是 Maximin，只不過加上了機率！

關鍵點： 對於 \( 2 \times n \) 遊戲，尋找底部的最高點。對於 \( n \times 2 \) 遊戲（此時繪製的是玩家 B 的機率 \( q \)，尋找頂部的最低點）。

5. 最優混合策略：線性規劃

當矩陣過大而無法使用簡單圖表（例如 \( 3 \times 3 \) 且無優勢）時，我們使用線性規劃 (Linear Programming) 和單純形法 (Simplex Algorithm)。

建立問題：

1. 將所有值轉為正數： 如果矩陣中有負數，在每個格子中加上一個常數 \( k \)，使所有數值 \( > 0 \)。（別忘了在最後得出遊戲價值後減回 \( k \)！）。
2. 設玩家 A 的機率為 \( p_1, p_2, p_3 \)。
3. 我們希望最大化價值 \( V \)，條件如下：
\( V \le \) (針對第 1 列的預期收益)
\( V \le \) (針對第 2 列的預期收益)
\( V \le \) (針對第 3 列的預期收益)
\( p_1 + p_2 + p_3 = 1 \)
4. 為便於單純形法計算，我們常將所有式子除以 \( V \)，並令 \( x_i = \frac{p_i}{V} \)。此時我們的目標變為最小化 \( \frac{1}{V} = x_1 + x_2 + x_3 \)。

如果覺得難也不必擔心： 考試中最常見的題目是要求你建立模型（寫出方程），而非要求完成整個單純形表格，但兩者都要做好準備！

重點複習盒：
- 鞍點： 行最大最小值 = 列最小最大值。
- 優勢原則： 刪除總是較小的行；刪除總是較大的列。
- 圖解法： 用於 \( 2 \times n \) 或 \( n \times 2 \) 遊戲。
- 線性規劃： 用於更大、不穩定的遊戲。

關鍵點： 線性規劃是博弈論中的「重型工具」。它將遊戲視為資源分配問題，以找出策略間的完美平衡。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。