博弈论交互模拟

博弈论（Game Theory）

由冯·诺依曼和纳什等人发展的数学理论，研究理性决策者之间的策略互动。纳什均衡是博弈论的核心概念。

📖 标准介绍

博弈论（Game Theory）是研究理性决策者在策略互动情境中如何做出最优决策的数学理论，由约翰·冯·诺依曼（John von Neumann）和奥斯卡·摩根斯特恩（Oskar Morgenstern）于1944年奠基，约翰·纳什（John Nash）在1950年代做出了突破性贡献。

核心概念：

纳什均衡（Nash Equilibrium）：每个参与者的策略都是对其他参与者策略的最优反应，任何一方单方面改变策略都不会获得更好的收益
占优策略（Dominant Strategy）：无论对手如何选择，某策略总是能带来最优结果
帕累托最优（Pareto Optimality）：不可能在不损害任何一方的情况下改善另一方的处境
零和博弈与非零和博弈：前者一方所得等于另一方所失，后者可以实现双赢或双输
完全信息与不完全信息博弈：参与者对博弈结构和收益的了解程度

博弈论广泛应用于经济学（市场竞争、拍卖设计）、政治学（投票、国际关系）、生物学（进化博弈）、计算机科学（算法设计、人工智能）等领域，为理解竞争、合作、谈判、冲突等现象提供了严谨的分析框架。

💬 通俗介绍

博弈论研究的是"你知道我知道你知道"的问题——当你的决策会影响别人，别人的决策也会影响你时，该怎么做出最聪明的选择？

🔍 经典例子：囚徒困境

两个罪犯被分开审讯：
• 都不招供 → 各判1年（证据不足）
• 一个招供，一个不招 → 招供的释放，不招的判10年
• 都招供 → 各判5年

理性分析：无论对方怎么选，招供总是更好（对方不招我招就释放，对方招我也招只判5年而不是10年）。结果两人都招供，各判5年——明明都不招只判1年更好！这就是个人理性导致集体不理性。

🌟 生活中的博弈论

价格战：两家超市都想降价吸引顾客，但如果都降价，利润都减少，不如都保持原价
公共资源：大家都想多用公共资源（如过度捕鱼），但如果都这样做，资源枯竭，大家都受损
考试作弊：如果大家都不作弊，凭实力竞争；但如果别人作弊你不作弊，你就吃亏了
交通拥堵：每个人都想走最快的路，结果大家都选同一条路，反而更堵

核心启示：在互动决策中，你不能只考虑自己的最优选择，还要预测对方会怎么想、怎么做，然后做出最优反应。有时候，个人最优≠集体最优，这就需要制度设计、信任建立或重复博弈来解决。

选择经典博弈场景

囚徒困境（Prisoner's Dilemma）

两个囚徒被分开审讯，可以选择合作（沉默）或背叛（坦白）。

-1

-3

-2

⭐ 纳什均衡

● 玩家1收益

● 玩家2收益

📊 博弈分析

互动模拟器

玩家1策略：

玩家2策略：

🔑 关键概念详解

🎯 纳什均衡

在纳什均衡点，任何一方单方面改变策略都不会获得更好的收益。这是博弈的稳定状态。

例子：在囚徒困境中，(背叛,背叛)是纳什均衡——虽然不是最好的结果，但没人愿意单独改变策略。

🤝 帕累托最优

在帕累托最优状态下，不可能在不损害任何一方的情况下改善另一方的处境。

例子：囚徒困境中(合作,合作)是帕累托最优——任何改变都会让至少一方变差。但它不是纳什均衡！

⚖️ 占优策略

无论对方选择什么策略，某一策略总是能带来最好的收益，这就是占优策略。

例子：在囚徒困境中，"背叛"是占优策略——无论对方合作还是背叛，背叛总是更好。

💡 如何理解收益矩阵？

收益矩阵（Payoff Matrix）是博弈论的核心工具，它清晰地展示了不同策略组合下各方的收益：

行代表玩家1的策略，列代表玩家2的策略
每个格子里有两个数字：红色是玩家1的收益，蓝色是玩家2的收益
找纳什均衡的方法：对每个格子，检查任何一方单独改变策略是否能获得更高收益。如果都不能，就是纳什均衡
绿色高亮的格子表示纳什均衡点——博弈的稳定结果

💡 小技巧：点击下方的不同博弈场景按钮，观察不同博弈的收益矩阵和纳什均衡位置，体会不同博弈的特点！

SimLabs