Game Theory - Further Mathematics A - H235 - Cambridge OCR AS Level

歡迎來到博弈論的世界！

在本章中，我們將探索博弈論 (Game Theory)，這是離散數學 (Discrete Mathematics) 中一個非常迷人的領域。別被它的名字騙了——雖然它可以用於棋盤遊戲，但實際上，它是經濟學家、軍事領袖和科學家用來理解人們如何在面對對手時做出決策的強大工具。

在讀完這些筆記後，你將能夠分析一個「博弈」，找出最佳策略，甚至預測該博弈是否「公平」。讓我們開始吧！

1. 零和博弈與收益矩陣

在進階數學 (Further Maths) 中，我們主要關注涉及兩名玩家的零和博弈 (zero-sum games)。所謂零和博弈，是指一方的收益等於另一方的損失。把它想像成一塊蛋糕：如果我拿走更大的一塊，你的那一份就恰好減少了相同的量。我們收益與損失的「總和」永遠為零。

什麼是收益矩陣 (Pay-off Matrix)？

為了分析一個博弈，我們會將結果放入一個稱為收益矩陣的網格中。通常我們有兩名玩家：列玩家 (Row Player)（我們稱她為 Rose）和行玩家 (Column Player)（我們稱他為 Colin）。

矩陣中的數字代表列玩家的收益：

正數表示列玩家從行玩家那裡贏得了積分或金錢。
負數表示列玩家輸了（意味著行玩家贏了！）。

例子：如果矩陣中的數值為 \(3\)，則 Rose 贏得 3，Colin 輸掉 3。如果數值為 \(-5\)，則 Rose 輸掉 5，Colin 贏得 5。

你知道嗎？

即使一個博弈起初看起來並非零和，我們通常也可以透過從每個條目中減去一個常數值來進行轉換 (convert)，直到「贏」與「輸」相對於起點達到平衡。

快速複習：在收益矩陣中，列玩家 (Row) 希望數值越大越好，而行玩家 (Column) 則希望數值越小（或越負）越好。

2. 優勢策略的藝術 (The Art of Dominance)

有時候，某位玩家會有一個非常糟糕的選擇，他絕對不會去選。我們使用「優勢論證 (dominance argument)」透過刪除這些劣勢選項來簡化博弈。

如何找出優勢：

對於列玩家 (Row Player)： 尋找其中一行，該行中的每一個數字都小於或等於另一行中對應的數字。為什麼要走那個「較差」的行呢？刪掉它！
對於行玩家 (Column Player)： 尋找其中一行，該行中的每一個數字都大於或等於另一行中對應的數字。請記住，行玩家希望數值越小越好。如果某一行數值較大，對他來說就更不利。刪掉它！

逐步指南：
1. 比較行與行。如果 Row A \(\le\) Row B，刪除 Row A。
2. 比較列與列。如果 Col X \(\ge\) Col Y，刪除 Col X。
3. 持續重複上述步驟，直到無法再刪除為止。

關鍵要點：透過優勢策略簡化矩陣，可以讓後續的計算輕鬆得多！

3. 保險策略與穩定解

如果你不知道對手會做什麼，你可能想採取「保險策略 (play safe)」，以確保無論發生什麼情況，你都能獲得一個最低限度的保證結果。這就是我們找出最大最小策略 (Maximin) 和最小最大策略 (Minimax) 的地方。

列玩家的策略 (Maximin)

Rose 查看每一行，找出她能贏得的最小值。然後，她選擇這些最小值中的最大值。這就是她的 Maximin（即「最壞情況下的最好結果」）。

行玩家的策略 (Minimax)

Colin 查看每一列，找出他可能輸掉的最大值。然後，他選擇這些最大值中的最小值。這就是他的 Minimax（即「壞結果中的最小損失」）。

穩定解（鞍點 Saddle Points）

如果 Maximin = Minimax，則該博弈有一個穩定解，也稱為鞍點 (Saddle Point)。
在穩定博弈中，任何單方面改變策略的玩家都無法提升自己的收益。他們都找到了「最佳」的純策略。

常見錯誤：學生經常會混淆列與行的邏輯。請記住：列玩家希望將最小值最大化；行玩家希望將最大值最小化。

快速複習：如果 Maximin \(=\) Minimax，博弈就是穩定的。如果不是，玩家就需要使用「混合策略 (mixed strategy)」。

4. 混合策略：保持不可預測性

如果沒有鞍點怎麼辦？如果你總是採取相同的行動，對手很快就會發現！在這種情況下，你應該以一定的機率來選擇不同的行動。這就是混合策略 (mixed strategy)。

解 2x2 博弈

如果你面對的是一個 \(2 \times 2\) 矩陣（在使用優勢策略簡化後），你可以計算出每種行動的最佳機率。

假設列玩家以機率 \(p\) 選擇第 1 行，以機率 \((1-p)\) 選擇第 2 行。
我們計算列玩家針對行玩家每種可能行動的期望值 (Expected Value, E)。

處理流程：
1. 寫出針對行玩家行動 1 的期望收益方程式。
2. 寫出針對行玩家行動 2 的期望收益方程式。
3. 將它們設為相等，從而求出 \(p\) 的值，這能讓你無論行玩家怎麼做，都處於「不敗之地」。

圖解法

有時候你可能會遇到 \(2 \times n\) 矩陣。你可以將期望值繪製成圖表上的直線，其中 x 軸為 \(p\)（從 \(0\) 到 \(1\)）。
1. 為 Colin 的每個選項畫出直線。
2. 由於 Rose 想要的是最小值的最大化，請在所有直線的下方邊界找出最高點。
3. 在那個「峰值」相交的直線，就告訴你 Colin 應該集中考慮哪兩個行動。

如果起初覺得棘手也別擔心！只要記得 \(p\) 只是個百分比。如果 \(p = 0.7\)，意思是你有 \(70\%\) 的機率執行該行動。如果某個行動明顯更好，最佳解甚至會出現在極端情況（\(p=0\) 或 \(p=1\)）。

關鍵要點：混合策略利用機率，即使對手知道你的整體計劃，也能確保在長期內獲得特定的「博弈價值」。

最終總結清單

你能識別零和博弈嗎？
你能利用優勢策略刪除無用的行或列嗎？
你能找出 Maximin 和 Minimax 來檢查是否存在鞍點嗎？
對於沒有鞍點的博弈，你能建立聯立方程式或圖表來找出最佳機率 (\(p\)) 嗎？

掌握這四個步驟，你就會成為博弈論專家！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。